shvarz: (Default)
[personal profile] shvarz
Пока я тут на лыжах катаюсь, у меня статья вышла: Random drift of HIV populations in culture. Она в свободном доступе, так что читайте.

Я этой статьей особенно горд, потому что я ее практически в одиночку провел от начала до конца. Придумал что и как делать, грант получил под эту идею, эксперименты все сделал, математика нашел данные обрабатывать, статью написал и в журнал заслал, от рецензентов отбился (они хотели больше данных). Если бы я остался в академии, то именно этим бы я сейчас и занимался, а теперь эта работа представляет для меня лишь академический интерес (pun intended).

Если кому интересно о чем статья, то я вкратце под катом напишу. Описание, правда, получилось довольно техническое и скучное. Извините, но расписываться мне сейчас некогда - надо бежать тусоваться с народом.

В почти любой популяции организмов существуют разные варианты одних и тех же генов (аллели). Микроэволюцию можно определить как изменение в пропорциях аллелей в популяции. Например, если в одном поколении аллели A и а были распределены в соотношении 50% на 50%, а в следующем поколении 45% на 55%, то это и есть эволюция.

Есть два основных механизма изменения частот аллелей - естественный отбор и случайный дрейф. Про естественный отбор все наслышаны, а вот случайный дрейф не так широко известен. А зря - он зачастую является более важной движущей силой эволюции, чем отбор.

Что такое случайный дрейф: положим у нас есть популяция, в которой 50% особей имеют аллель A, а другие 50% - аллель a. Положим, что эти аллели совершенно равноценны по своим свойствам. Какова будет частота этих аллелей в следующем поколении? Если популяция бесконечно большая, то так и останется 50/50. Однако если популяция очень маленькая, допустим всего 10 особей, то предсказать частоты становится сложнее - это все равно, что предсказать результат вытаскивания 10 шаров из мешка, в котором половина шаров красные, а половина - черные. Можно вытащить и 5/5, а можно и 4/6 и 10/0. У этих исходов разная вероятность, но все они возможны. Довольно очевидно, что чем меньше популяция, тем больше роль случая в изменении частот аллелей, и тем значительнее изменения в частоте аллелей. Этот процесс описывается тривиальной формулой, в которой вариация (expected variance) частоты аллелей обратно пропорциональна размеру популяции.

Эволюция HIV внутри одного зараженного человека - основная проблема для разработки противовирусных лекарственных препаратов. Вирус мутирует и устойчивые к лекарствам мутанты распространяются в (внутричеловековой) популяции. Поэтому механизмы эволюции HIV активно исследуются. Довольно давно был замечен следующий странный факт: хотя размер популяции HIV внутри одного человека очень велик (10^7-10^8), в его популяции происходит неожиданно активный генетический дрейф. Надо отметить, что в реальных популяциях генетический дрейф всегда немного выше ожидаемого. Однако для HIV разница оказалось очень велика: дрейф там такой, как если бы популяция была 10^3-10^5 (то есть разница между реальным и ожидаемым - 3-4 порядка величины). Для объяснения этого факта были придуманы несколько разных гипотез, между которыми сейчас и идет борьба. Народ дискутирует, собирает данные о генотипах и структуре популяции, моделирует это все математически, и интерпретирует результаты самыми разными образом. Я в них вдаваться не буду, скажу лишь что они достаточно сложны.

В этой статье мы задали простой вопрос: Каково количество генетического дрейфа в популяции HIV в условиях близких к идеальным? В условиях, в которых нет никакой необходимости применять все эти сложные теории?

Я придумал систему, в которой можно достаточно точно измерять размер популяции HIV и происходящий в этой популяции генетический дрейф. Используя эту систему я нашел, что даже в такой простой системе, как культура клеток, наблюдаемый генетический дрейф в 10 раз больше чем можно ожидать исходя из размера вирусной популяции. Пытаясь разобраться почему это так происходит, я выяснил, что достаточно большое влияние оказывает "неодновременность" инфекции. По воле случая некоторые вирусы заражают клетки раньше, чем другие и это уменьшает эффективный размер популяции вирусов. Если инфекцию синхронизировать, то разница уменьшается до 3-х раз. Откуда берутся эти три раза я уже выяснить не смог (кстати, именно этого требовали от меня рецензенты), но могу предположить, что все дело в небольших различиях между заражаемыми клетками. Некоторые из них производят много вирусов, некоторые - мало. Недавно вышла статья, подтверждающая мои предположения. В ней было показано (для другого вируса), что различия между клетками могут быть очень большими - до 4 порядков величины.

Что все это в итоге значит? Это значит, что люди пытающиеся разобраться в том, как эволюционирует популяция HIV, должны принимать во внимание в своих моделях тот факт, что репликация вируса сама по себе является стохастическим процессом и может существенно влиять на генетический дрейф. Вот, собственно, и все :)
From: [identity profile] shvarz.livejournal.com
Так я не понял - никаких ошибок таки нет, или вы все еще считаете, что там что-то неправильно?

Кстати, о строгом математическом определении: Вы привели строгое математическое определение variance effective pop.size, а я говорил о effective pop.size. Для первого действительно есть строгое определение, а я говорил о вотором, для которого - нет. Обычно когда говорят effective pop.size, то имеют в виду variance effective pop.size, но не всегда. Отсюда и "эфемерность" этого понятия в биологии (в биологии вообще, популяционные биологи более корректно к этому подходят).
From: [identity profile] artemn.livejournal.com
Это я перепутал :(

Меня сбили с толку слова о "количестве генетического дрейфа", которые для меня звучат еретически. Только со второго просмотра я понял, что именно вы имеете ввиду.
From: [identity profile] shvarz.livejournal.com
Хм, а как еще это можно сказать? Я вообще по-разному представлял эти данные людям. Сначала оперировал исключительно терминами variance effective population size, там можно говорить про больший/меньший размер, но неподготовленной аудитории это очень трудно воспринимать, все путаются и не понимают, почему размер популяции не постоянен. В итоге я перевернул формулу и стал говорить о variance, но это вообще звучит для среднего биолога пугающе. Отсюда и "amount of genetic drift" - может не самая красивая фраза, но смысл, на мой взгляд, передает достаточно точно.
From: [identity profile] artemn.livejournal.com
Ну просто дело в том, что генетический дрейф не померить. Нет единиц измерения для него. Можно говорить о роли дрейфа в эволюции. Предполагается, что в модели РФ чем больше размер популяции, тем меньше случайные эффекты влияют на фиксацию не нейтральных генов (для нейтральных генов размер популяции не важен). Так вот моя претензия была, что вы как бы утверждаете, что очень сильное влияние оказывают случайные силы в эволюции вируса, но строго говоря variance effective population size об этом говорит недостаточно. (это я так misinterpreted вашу статью сначала)

Я бы лично предпочел при чтении, если бы везде var. effective pop. s. стояло, но я понимаю и ваши доводы.
Edited Date: 2009-03-28 01:15 am (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
почему же нельзя дрейф померить? его точно так же можно померить, как и кривую монету - как вероятность того, что через N поколений у нас аллель в некоторой популяции изчезнет
From: [identity profile] artemn.livejournal.com
Правильно. Вот вы мою точку зрения вроде бы и подтверждаете. Математически в среднем это (то, о чем вы пишете) есть скорость уменьшения гетерозиготности, которая конечно же зависит от распределения числа потомков, однако в сложных и реалистичных моделях не определяется однозначно variance эффективным размером популяции.
From: [identity profile] shvarz.livejournal.com
Мне кажется, что если отойти от вероятности фиксации аллеля и просто мерить его случайные флуктуации за одно поколение, то это и будет вполне нормальным мерилом дрейфа. Определяемым экспериментально через variance и нормализуемым делением на p(1-p).
From: [identity profile] artemn.livejournal.com
Дрейф нам сам по себе не важен. Нам важны эволюционные результаты этого дрейфа, в глобальном смысле. То, с чего я начал. Когда отбор действует, а когда все можно считать нейтральным. Определяется через величину Ns в модели РФ (сильно маленькое или не очень). Так вот эту N часто путают с той N, которую вы вычисляется в своей статье, хотя никаких общих утверждения относительно их равенства не существует.
From: [identity profile] shvarz.livejournal.com
Популяция HIV существует в промежутке, когда Ns~1. И мутации в каждом третьем потомке. И постоянно меняющийся fitness landscape. И иммунная система, отвлекающаяся на каждого мутанта, что и ведет к болезни. Так что вам, может, дрейф сам по себе и не важен, а нам - важен.
From: [identity profile] artemn.livejournal.com
Разумеется, я не специалист по HIV, и мое мнение тут мало что значит.

Что я хотел подчеркнуть: вы изучаете HIV пользуясь совершенно точно математически определяемым понятием эффективного размера популяции. После этого пользуетесь найденными оценками, пытаясь определить "величину генетического дрейфа", хотя определение, приведенное vasia_iz_aa, гораздо более естественно для этого понятия (естественно математически). У него и свой эффективный размер популяции есть -- так называемый eigenvalue effective population size. Вы же постом выше предложили этот эффективный размер популяции игнорировать :)

December 2013

S M T W T F S
1234567
891011121314
15161718192021
22232425262728
293031    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 24th, 2025 10:33 am
Powered by Dreamwidth Studios