Шрифт:
Рис. 12-2б. Эволюция нуклеотид-связывающих доменов ГТФаз и родственных им АТФаз, по данным из Leipe et al., 2002. Указаны только хорошо изученные белки. Динеин, динамин, кинезин и миозин – моторные ГТФазы и АТФазы, ассоциированные с цитоскелетом; Ras/Rho – сигнальные ГТФа-зы, ассоциированные, в частности, с эндомембранной системой эукариот; G-белки – ассоциированные с мембраной ГТФазы, функционирующие совместно с G-белок-сопряженными рецепторами; PurA и PyrG – ферменты метаболизма нуклеотидов; ArgK, аргинин-киназа, – фермент метаболизма аминокислот; Mrp и MinD – АТФазы, участвующие в клеточном делении прокариот; SRP – частица узнавания сигналов.
Эволюционный анализ обширнейшего класса фосфат-связывающих доменов (известных также как P-петли) ГТФаз, в котором множество трансляционных факторов образует компактные семейства, приводит, в сущности, к тому же результату: в последовательности эволюционных бифуркаций (ветвлений эволюционного древа), представляющей историю ГТФазного домена, трансляционные факторы также возникли сравнительно поздно (см. рис. 12-2а; Leipe et al., 2002). ГТФазы образуют лишь одну из многих больших ветвей эволюционного древа укладки, содержащей Р-петлю, которая включает огромное разнообразие белковых доменов, связывающих НТФ (нуклеозидтрифосфаты – чаще всего субстратом является АТФ, гораздо реже ГТФ и изредка – другие НТФ) и расщепляющих --фосфодиэфирную связь (см. рис. 12-2б). Эта укладка является самым распространенным доменом во всех прокариотах (Wolf et al., 1999b), и во всех реконструкциях генетического разнообразия LUCA(S) выявляется несколько десятков содержащих Р-петлю белков. Таким образом, интенсивная эволюция домена, содержащего Р-петлю, предшествовала не только LUCA(S), но и, что еще более удивительно, современной системе трансляции. Сама Р-петля (известная также под названием мотива Уолкера A [127] , рис. 12-3), богатая глицином петля, оборачивающая фосфатный конец НТФ-субстрата, является наиболее консервативным мотивом среди всех белковых последовательностей, несомненно зафиксированным на самых ранних стадиях белковой эволюции (Gorbalenya and Koonin, 1989; Trifonov et al., 2006).
127
Джон Уолкер (будущий лауреат Нобелевской премии за структуру мембраны АТФазы) и его коллеги впервые описали фосфат-связывающую петлю в 1982 г. (J. E. Walker, M. Saraste, M. J. Runswick, and N. J. Gay. Distantly Related Sequences in the Alpha– and Beta-Subunits of ATP Synthase, Myosin, Kinases, and other ATP-Requiring Enzymes and a Common Nucleotide Binding Fold. EMBO Journal 1 [1982]: 945–951) как мотив, присутствующий в двух субъединицах H+-АТФазы и ряде других АТФ-связывающих белков, имеющих мало иного структурного сходства между собой или вовсе несходных. Неожиданная консервация этого мотива в самых разнообразных вирусных белках была предметом моей самой первой работы в вычислительной биологии (Горбаленя А. Е., Блинов В. М., Донченко А. П., Кунин Е. В. Молекулярная генетика, микробиология и вирусология 11 [1985]: 30–36). Я полагаю, что точное попадание в наиболее консервативный белковый мотив в столь ранней работе было сочетанием счастливого случая и «предпочтительного присоединения».
Рис. 12-3. Р-петля, древнейший и самый распространенный в белковых последовательностях мотив. На рисунке изображено выравнивание Р-петель восьми древних НТФаз, каждая из которых, по данным эволюционных реконструкций, была представлена в LUCA(S) (Mirkin et al., 2003). Для каждой линии представлены три последовательности: бактерии (Escherichia coli, Ecoli), археи (Pyrococcus abyssi, Pabys) и эукариота (дрожжи Saccharomyces cerevisiae, Scere). Белыми буквами на черном фоне обозначены аминокислотные остатки, напрямую взаимодействующие с фосфатным концом НТФ, а серым фоном – характерная гидрофобная -последовательность, предшествующая ФСП. SRP – частица узнавания сигналов.
Таким образом, из сравнительного анализа древних паралогических отношений между белковыми компонентами системы трансляции следует бесспорный, хоть и парадоксальный, вывод: за интересным исключением основных рибосомных белков, все белки, играющие главную роль в современной трансляции, возникли в результате долгой и сложной эволюции различных белковых доменов. Возникает замкнутый круг: для возникновения этих белков требуется точная и эффективная система трансляции. Древняя система трансляции могла быть и не столь совершенной, как современная, но несомненно, что она отличалась от нее не более чем на порядок по точности и скорости, иначе белковая эволюция не стала бы возможной. Однако из всего, что нам известно о современной системе трансляции, такой уровень точности невообразим без сложного и специализированного белкового аппарата.
Итак, система трансляции ярко высвечивает парадокс Дарвина – Эйгена, присущий любому анализу возникновения сложных биологических систем: для работы эффективной и точной системы трансляции современного типа требуется множество различных белков, но для того, чтобы эти белки могли возникнуть, нужна система трансляции почти столь же совершенная, как современная. По-видимому, существует только одно возможное разрешение этого парадокса, а именно через отказ от первой части противопоставления: следует заключить, что трансляционная система, сравнимая с современной по точности и скорости, работала в отсутствие значительного разнообразия белков и, возможно, вообще без белков. Таким образом, основываясь на сравнительном анализе составных частей системы трансляции, мы должны сделать предположение о существовании сложного и разнообразного мира РНК, в котором уже действовала некая разновидность цикла Дарвина – Эйгена.
Это не все, что может нам дать сравнительный анализ: сравнение самих РНК также вскрывает важные явления и загадывает поразительные загадки. Так, анализ большой рибосомной субъединицы РНК 23S выявил иерархический сценарий последовательности дупликаций, способной привести от простой древней шпильки РНК к современной, сложной, универсально консервативной структуре рРНК (Bokov and Steinberg, 2009).
Консерватизм структуры определенных элементов последовательностей (таких как псевдоуридиновая петля) и даже сайтов модификации тРНК всех специфичностей (и, разумеется, всех видов) не оставляет сомнений в том, что все они эволюционировали от общего предка (Eigen et al., 1989). Отсюда, при сравнении современных последовательностей и структур, возникает второй парадокс эволюции трансляции. Если на некоторой стадии эволюции существовал единственный предок тРНК всех специфичностей, то как могла подобная трансляционная система действовать, точнее, как она могла обеспечивать специфичность кодирования аминокислотных последовательностей нуклеотидными? Если же на этом этапе трансляционной системы еще не существовало, то что привело к эволюции специфичной к аминокислотам тРНК?
Мы обратимся к этим и смежным вопросам ниже, но сначала следует хотя бы кратко рассмотреть центральное понятие в области исследования происхождения жизни: мир РНК.
Рибозимы и мир РНК
Центральная догма молекулярной биологии (Crick, 1970) постулирует, что информация передается от ДНК к белку посредством РНК (Фрэнсис Крик дополнил ее возможностью обратной передачи информации от РНК к ДНК после открытия обратной транскрипции):
Очевидно, размышляя о происхождении первых живых форм, мы оказываемся перед вопросом типа «курица или яйцо»: что появилось первым – ДНК или белок? ген или его продукт? В такой постановке вопрос, естественно, неразрешим из-за парадокса Дарвина – Эйгена: чтобы реплицировать и транскрибировать ДНК, нужны функционально активные белки, но производство этих белков, в свою очередь, требует точной репликации, транскрипции и трансляции нуклеиновых кислот. Если строго следовать центральной догме, невозможно вообразить, каким мог быть начальный материал для цикла Дарвина – Эйгена. Даже вынесение ДНК из триады и постулат о том, что изначальный генетический материал состоял только из РНК (и сведение, таким образом, триады к диаде), хоть и является ценной идеей (см. следующую главу), но не помогает разрешить парадокс. Чтобы эволюция в сторону усложнения началась, система должна каким-то образом вступить в цикл Дарвина – Эйгена до того, как установится связь между РНК-матрицами (информационной частью системы) и белком (исполнительной частью).