Начну я из далека, чтобы к концу добраться до сути моих «претензий».
Что изучает теоретическая популяционная генетика? Она изучает две вещи. Первое – это абстрактные математические модели изменения частот аллелей в популяции. Второе – связь результатов анализа математических моделей и реальности. Первое – моделирование, второе – верификация модели. Часто, к сожалению, результаты моделирования переносятся на реальные популяции некритически, что я и попытаюсь объяснить.
Одна из самых известных моделей в генетике – модель Фишера-Райта, которая была записана, чтобы учитывать случайные эффекты в измении частот аллелей. Есть несколько совершенно строгих предположений, на которых эта модель основана. Для простоты предположим, что мы рассматриваем нейтральную аллель (отсутствует отбор). Каковы эти предположения: 1) рассматривается популяция постоянного фиксированного размера N (N – это число особей в популяции, пусть опять же для простоты популяция гаплоидная, в книжках обычно рассматривают диплоидные популяции, поэтому число гамет 2N, но у меня будет просто N, для дальнейшего сравнения); 2) рассматриваются неперекрывающиеся поколения: родители дают потомство в размере N и тут же все помирают; 3) потомство получается с помощью выбора с возвращением: пусть есть два аллеля (шары синего и красного цвета), мы вытаскиваем шарик из закрытого мешка, отмечаем его цвет и кладем обратно, и так N раз, в итоге получаем новое поколение (чтобы ввести отбор надо предположить, что шарики, например, синего цвета более предпочтительны для того, кто их вытаскивает). Случайность (тот самый дрифт-дрейф) появляется в модели именно из-за случайного распределения потомков. Математически это так называемое биномиальное распределение, которое задает число данного аллеля в следующем поколении.
Имея модель, теперь мы можем озадачиться разумными вопросами. Например таким: в популяции синих шаров появляется мутант, красный шар. Какова вероятность, что в какой-то момент времени в будущем все потомки будут красными (аллель зафиксируется)? В случае нейтральных аллелей ответ почти очевиден: 1/N (кстати, математически это серьезный результат, там надо по-хорошему мартингалы применять для доказательства и всякие умные теоремы). Если аллели не нейтральны, то точный ответ найти уже для этой модели не удалось! Кимура придумал диффузионное приближение (он построил модель модели) и получил ответ в виде известной формулы, которую я писать не буду, но уверен, что хозяин журнала ее знает. Так же можно вычислить среднее время фиксации единичного мутанта, и много, много разных других вещей... в частности, если у нас есть мутации в популяции, в одном аллели вероятность мутации u, тогда в популяции в каждом поколении будет в среднем Nu мутаций, а так как фиксируется только 1/N часть, то скорость эволюции (среднее число зафиксированных мутаций на единицу времени) есть просто Nu умножить на 1/N равно u! (не зависит от размера популяции в нейтральной модели).
Из формулы для фиксации не нейтрального аллеля следует один очень важный вывод. Если Ns, где s – селективное преимущество, мало, то наши аллели ведут себя в модели Райта-Фишера практически как нейтральные, дрейф все побеждает. Если же Ns не мало (что часто выполняется для больших популяций), то (когда этого аллеля будет много в популяции!) стохастическими эффектами можно пренебречь и рассматривать детерминированные модели, которые анализируются достаточно просто. Итак, влияние дрейфа в модели РФ определяется размером популяции при прочих фиксированных величинах и малых s.
В частности легко вычислить диспесию числа потомков синих шаров в следующем поколении, если в данном поколении частота потомков p (p=k/N, где k – число шаров). Из свойств биномиального распределения следует (таким образом, из модели Райта-Фишера!), что var(X|k)=Np(1-p), то есть частота в следующем поколении будет иметь дисперсию var(p(t+1)|p(t))=p(1-p)/N. Подчеркиваю, что этот результат получен при всех вышеописанных предположениях.
Пока все что я говорил – это о модели Райта-Фишера и ее строгом математическом анализе. Ни о каких абстрактных и идеолизированных популяциях не было сказано ни слова.
Об эффективном размере популяции
Date: 2009-03-26 04:30 pm (UTC)Что изучает теоретическая популяционная генетика? Она изучает две вещи. Первое – это абстрактные математические модели изменения частот аллелей в популяции. Второе – связь результатов анализа математических моделей и реальности. Первое – моделирование, второе – верификация модели. Часто, к сожалению, результаты моделирования переносятся на реальные популяции некритически, что я и попытаюсь объяснить.
Одна из самых известных моделей в генетике – модель Фишера-Райта, которая была записана, чтобы учитывать случайные эффекты в измении частот аллелей. Есть несколько совершенно строгих предположений, на которых эта модель основана. Для простоты предположим, что мы рассматриваем нейтральную аллель (отсутствует отбор). Каковы эти предположения: 1) рассматривается популяция постоянного фиксированного размера N (N – это число особей в популяции, пусть опять же для простоты популяция гаплоидная, в книжках обычно рассматривают диплоидные популяции, поэтому число гамет 2N, но у меня будет просто N, для дальнейшего сравнения); 2) рассматриваются неперекрывающиеся поколения: родители дают потомство в размере N и тут же все помирают; 3) потомство получается с помощью выбора с возвращением: пусть есть два аллеля (шары синего и красного цвета), мы вытаскиваем шарик из закрытого мешка, отмечаем его цвет и кладем обратно, и так N раз, в итоге получаем новое поколение (чтобы ввести отбор надо предположить, что шарики, например, синего цвета более предпочтительны для того, кто их вытаскивает). Случайность (тот самый дрифт-дрейф) появляется в модели именно из-за случайного распределения потомков. Математически это так называемое биномиальное распределение, которое задает число данного аллеля в следующем поколении.
Имея модель, теперь мы можем озадачиться разумными вопросами. Например таким: в популяции синих шаров появляется мутант, красный шар. Какова вероятность, что в какой-то момент времени в будущем все потомки будут красными (аллель зафиксируется)? В случае нейтральных аллелей ответ почти очевиден: 1/N (кстати, математически это серьезный результат, там надо по-хорошему мартингалы применять для доказательства и всякие умные теоремы). Если аллели не нейтральны, то точный ответ найти уже для этой модели не удалось! Кимура придумал диффузионное приближение (он построил модель модели) и получил ответ в виде известной формулы, которую я писать не буду, но уверен, что хозяин журнала ее знает. Так же можно вычислить среднее время фиксации единичного мутанта, и много, много разных других вещей... в частности, если у нас есть мутации в популяции, в одном аллели вероятность мутации u, тогда в популяции в каждом поколении будет в среднем Nu мутаций, а так как фиксируется только 1/N часть, то скорость эволюции (среднее число зафиксированных мутаций на единицу времени) есть просто Nu умножить на 1/N равно u! (не зависит от размера популяции в нейтральной модели).
Из формулы для фиксации не нейтрального аллеля следует один очень важный вывод. Если Ns, где s – селективное преимущество, мало, то наши аллели ведут себя в модели Райта-Фишера практически как нейтральные, дрейф все побеждает. Если же Ns не мало (что часто выполняется для больших популяций), то (когда этого аллеля будет много в популяции!) стохастическими эффектами можно пренебречь и рассматривать детерминированные модели, которые анализируются достаточно просто. Итак, влияние дрейфа в модели РФ определяется размером популяции при прочих фиксированных величинах и малых s.
В частности легко вычислить диспесию числа потомков синих шаров в следующем поколении, если в данном поколении частота потомков p (p=k/N, где k – число шаров). Из свойств биномиального распределения следует (таким образом, из модели Райта-Фишера!), что var(X|k)=Np(1-p), то есть частота в следующем поколении будет иметь дисперсию var(p(t+1)|p(t))=p(1-p)/N. Подчеркиваю, что этот результат получен при всех вышеописанных предположениях.
Пока все что я говорил – это о модели Райта-Фишера и ее строгом математическом анализе. Ни о каких абстрактных и идеолизированных популяциях не было сказано ни слова.