Шрифт:
Слабость или даже отсутствие некоторых интуитивно ожидаемых корреляций между эволюционными и фенотипическими переменными кажутся не менее поразительными, чем обнаруженные корреляции. В самом деле, биологическая интуиция всей этой области знаний подсказывает, как было указано в начале этого раздела, что гены с большей «биологической значимостью» будут эволюционировать медленнее и будут теряться с меньшей вероятностью (Wilson et al., 1977). Общее понятие биологической важности можно конкретизировать измерением фенотипических эффектов от нокаута или других мутаций многих генов – желательно всех генов многих организмов. Можно предположить, что чем больше эффект от нокаута гена, тем медленнее этот ген будет эволюционировать, и гены, утрата которых вызывает летальный эффект, будут эволюционировать значительно медленнее генов, менее существенных для выживания. К настоящему времени проведено сравнение фенотипических эффектов нокаута генов и скоростей эволюционирования генов для множества модельных организмов и получен недвусмысленный и как будто парадоксальный результат: связь между экспериментально измеренной биологической важностью гена и скоростью его эволюции очень слаба, если вообще существует (Hurst and Smith, 1999; Jordan et al., 2002; Krylov et al., 2003; Wang and Zhang, 2009). Еще более удивительным кажется отсутствие сильной корреляции между скоростью утраты гена в течение эволюции, представляющей в некотором смысле временную меру биологической важности или существенности гена, и экспериментально определенным эффектом на приспособленность: только те наборы генов, которые вообще не утрачиваются на продолжительных отрезках эволюции, таких как вся эволюция эукариот, обогащены «важными» генами (Krylov et al., 2003; Wang and Zhang, 2009). Первые работы, показавшие почти полное отсутствие связи между скоростью эволюции и биологической значимостью, были основаны на простом измерении эффекта (присутствует/отсутствует) нокаута гена (соответственно, существенный/несущественный ген). Можно предполагать, что такие измерения слишком грубы и не дают осмысленной оценки биологической важности. Однако, например, в последних работах лаборатории Джорджа Занга было продемонстрировано почти полное отсутствие корреляции между скоростью эволюции и весьма точно измеренным влиянием на приспособленность пекарских дрожжей (S. cerevisiae) во множестве различных условий (Wang and Zhang, 2009), что уменьшает вероятность получения неадекватных результатов.
Чем же тогда объяснить неожиданно слабую связь между эволюцией и функцией гена? По отношению к эволюции последовательностей можно предположить, что скорость эволюции более зависит от внутренних характеристик гена (в особенности от структуры кодируемого белка), чем от его биологической значимости. Однако это объяснение неприменимо к случаям утраты гена. Наиболее осмысленным – хотя опять-таки противоречащим здравому смыслу – кажется следующее объяснение: фенотипический эффект нокаута гена (и в целом – набора необходимых генов) не проявляется как консервативное свойство в эволюционном процессе и быстро меняется (в масштабах эволюционной шкалы), вероятно благодаря высокой скорости эволюции сетей взаимодействующих генов [39] . Ясно, что это предположение можно проверить опытным путем, пусть и с помощью трудоемких экспериментов.
39
Это предположение хорошо согласуется с результатами более ранней работы того же Джорджа Занга, в которой показано, что «мгновенная» скорость эволюции (то есть скорость, измеренная путем сравнения ортологов из близких видов) гораздо лучше коррелирует с эффектом нокаута (важностью гена), чем скорость, измеренная на более протяженных эволюционных интервалах (Zhang J, He X. Significant impact of protein dispensability on the instantaneous rate of protein evolution. Mol Biol Evol. 2005 Apr;22(4):1147-55). С другой стороны, конечно же не следует забывать, что предложенная гипотеза имеет статистический характер и не относится к группе наиболее важных генов (например, гены рибосомных белков остаются незаменимыми на протяжении всей эволюционной истории).
Почти нейтральные сети и белковая эволюция
В целом скорость эволюции гена определяется размером его почти нейтральной сети, то есть множества последовательностей, получаемых друг из друга в результате одношаговых мутаций (пусть и необязательно с помощью одной замены) и имеющих приспособленность примерно такую же, как и у наиболее приспособленной последовательности (Wagner, 2008a; Wolf et al., 2010). Чем больше нейтральная сеть, тем слабее ограничения для конкретного гена, тем быстрее он может эволюционировать (рис. 4–5).
Рис. 4–5. Почти нейтральная сеть и белковая эволюция. Две почти нейтральные сети для двух вымышленных белков схематично представлены как две области, находящиеся на широких вершинах пиков приспособленности.
В эволюции белка приспособленность отдельной последовательности в основном зависит от ее устойчивости к ошибкам укладки и от уровня экспрессии, а размер почти нейтральной сети зависит от высоты и формы пика, занимаемого этой последовательностью и ее соседями на ландшафте устойчивости (рис. 4–6). В этой модели высокоэкспрессированные белки, чьи исходные последовательности высоко устойчивы к ошибкам укладки, занимают высокие и крутые пики с небольшой областью высокой приспособленности (малые почти нейтральные сети) и, следовательно, подвержены сильному стабилизирующему отбору и медленно эволюционируют. И наоборот, белки с более низким уровнем экспрессии и меньшей устойчивостью находятся на более низких, пологих пиках, имеют более широкую область высокой приспособленности и, соответственно, подвержены более слабому отбору и имеют высокую скорость эволюции (рис. 4–6; Wolf et al., 2010).
Рис. 4–6. Модель эволюции белка, управляемой издержками неточной укладки.
Геномная эволюция путем дупликации генов, модель рождения и смерти гена и универсальное распределение численности паралогичных семейств
Мы уже касались вопроса дупликации генов в предыдущей главе, в частности при построении списка важнейших механизмов геномной эволюции. Однако есть еще по крайней мере два хороших повода вернуться к этому механизму эволюции и обсудить его более детально. Во-первых, дупликация несомненно является одним из главных путей геномной эволюции для всех форм жизни и играет принципиальную роль в эволюции эукариот (см. гл. 8). Во-вторых, эволюция путем дупликации генов представляет собой формально простой процесс, для которого довольно легко построить хорошо работающие физические (или математические) модели, которые и рассматриваются в этой главе.
Представление о дупликации как об исключительно эффективном способе геномной эволюции лежит в основе современного эволюционного мышления. Упрощенно говоря, сущность этого представления состоит в том, что создание новых функциональных объектов (белков и РНК) путем модификации уже имеющихся (вспомните модель «эволюции как мастерового» Жакоба; Jacob, 1977) – это, очевидно, намного более простой путь, чем создание этих объектов с самого начала, с нуля (история этой идеи рассказывается в гл. 2). Как и другие представления геномики, эволюция путем генной дупликации имеет строгие количественные подтверждения – большинство генов в геноме принадлежат семействам паралогов (за исключением очень небольших геномов, таких как у микоплазмы и других паразитических бактерий; Jordan et al., 2001). Более детальная реконструкция эволюции показывает, что дупликация проявляется, с различной интенсивностью, на всех этапах эволюции, таким образом, любой геном – это набор дупликаций самого различного возраста. Выбирая некоторую эволюционную линию, допустим, животные – хордовые – млекопитающие – приматы – и т. д., мы можем обнаружить в геноме (например, в нашем) все соответствующие классы дупликаций: дупликации, специфичные для животных, дупликации, специфичные для хордовых, специфичные для приматов и т. д. (Lespinet et al., 2002).
Распределение численности паралогичных семейств в любом геноме – еще одна универсальная статистическая закономерность, обнаруженная сравнительной геномикой (рис. 4–7). Распределения для всех геномов приблизительно описываются степенной функцией с отрицательным показателем степени: y = ах– y (где у – положительное число, а – коэффициент; Koonin et al., 2002; Luscombe et al., 2002). Эти распределения, имеющие в двойных логарифмических координатах вид прямых линий, показывают, что большинство семейств по численности малы (включая семейства геномов с преобладанием синглетонных сайтов), и только немногие семейства включают в себя большое число паралогов.
Рис. 4–7. Распределение размера семейств паралогичных генов для нескольких сильно отличающихся геномов. Показаны распределения для растения резуховидки Таля (A. thaliana), человека (H. sapiens), для пекарских дрожжей (S. cereviseae), для сенной палочки (B. subtilis) и для бактерии Thermotoga maritima. Использованы данные из базы данных EggNog (Jensen et al., 2008)