Шрифт:
Для начала Поволоцкая и Кондрашов решили выяснить, достигли уже эти белки максимального расхождения в пространстве последовательностей или их расхождение (накопление различий) все еще продолжается. Сохранение сходства после 3,5 млрд лет независимой эволюции, казалось бы, говорит о том, что возможности изменения этих белков ограниченны. Можно предположить, что области в пространстве последовательностей, соответствующие их функциям, невелики и предел расхождения давно достигнут. Но возможно и другое объяснение. Эти области могут быть велики, но труднопроходимы. Например, они могут представлять собой лабиринт из узких хребтов, разделенных пропастями, и поэтому на «освоение» всего доступного пространства не хватило миллиардов лет, прошедших со времен LUCA.
Исследователи проводят аналогию между эволюцией белков и расширением Вселенной. Эдвин Хаббл обнаружил, что галактики удаляются друг от друга, причем расстояние между галактиками положительно коррелирует со скоростью их разлетания. Экстраполируя эту тенденцию в прошлое, Хаббл пришел к выводу, что разлетание должно было начаться из одной точки. Эта идея легла в основу теории Большого взрыва. Нечто подобное происходит и с белками, расходящимися от общего предка – исходного белка с данной функцией, который был закодирован в геноме LUCA.
Принцип анализа белковых последовательностей, примененный Поволоцкой и Кондрашовым. Использовались четверки гомологичных белков, родственные отношения между которыми изображены в виде дерева. Анализ такой четверки позволяет понять, растет или снижается сходство между первыми двумя белками и четвертым. В данном случае считается, что у первого белка «предковая» (имеющаяся у белков 2 и 3) аминокислота R в 11-й позиции (выделена жирным шрифтом) заменилась на E, что привело к росту сходства первого белка с четвертым, т. е. к их сближению в пространстве последовательностей. У второго белка «предковая» аминокислота K в 3-й позиции (выделена полужирным шрифтом) заменилась на Y, что привело к снижению сходства второго белка с четвертым, т. е. к их расхождению в пространстве последовательностей. По рисунку из Povolotskaya, Kondrashov, 2010.
Чтобы выяснить, закончилось ли уже расширение «вселенной древних белков» или оно продолжается до сих пор, авторы применили оригинальные методы анализа белковых последовательностей. Нам будет полезно с ними ознакомиться – хотя бы для того, чтобы понять логику биоинформатики, молодой науки, занимающейся сравнением и осмыслением генетических текстов.
Использовались четверки гомологичных (происходящих от одного предка) и выполняющих одну функцию белков. Первые два белка в каждой четверке – это близкородственные молекулы с похожими аминокислотными последовательностями. Эти два белка назывались «сестринскими», и именно их эволюция анализировалась в рамках данной четверки.
Третий белок отличался от сестринских белков сильнее, чем они друг от друга. Он выполнял роль «внешней группы», позволяя понять, какие аминокислотные замены произошли в первом, а какие во втором сестринском белке. Например, если у внешнего белка в данной позиции стоит аминокислота K (лизин) и такая же аминокислота стоит здесь у первого из двух сестринских белков, а у второго в этом месте находится другая аминокислота (например, Y – тирозин), то считалось, что K в данной позиции – это «предковое», исходное состояние, а у второго сестринского белка произошла замена K на Y.
К этим трем белкам добавлялся четвертый, еще более далекий от сестринских, чем третий. Если у четвертого белка в данной позиции стоит аминокислота K (как на рисунке), то делался вывод, что у второго сестринского белка произошло эволюционное изменение, увеличившее дистанцию между белками 2 и 4: белки разошлись. Если бы у четвертого белка здесь стояла аминокислота Y, то был бы сделан вывод, что в результате изменения, затронувшего белок 2, белки 2 и 4 сблизились.
В общей сложности было обработано 13,6 млн таких четверок. Для каждой четверки определялось число замен, ведущих к сближению последовательностей и к их расхождению. По соотношению этих двух величин можно понять общую тенденцию: расходятся ли белки, сближаются или балансируют вокруг некого постоянного уровня сходства последовательностей.
Оказалось, что даже у наиболее удаленных друг от друга гомологичных белков тенденция к расхождению значительно преобладает над тенденцией к сближению. Следовательно, «вселенная древних белков» продолжает расширяться и пределы областей, соответствующих их функциям, за 3,5 млрд лет так и не были достигнуты. Эволюция этих белков была крайне медленной. Что же ее сдерживало? Решению этой проблемы посвящена вторая часть статьи, приводящая на память другой рассказ Борхеса – «Сад расходящихся тропок».
Лабиринт расходящихся тропок
Обычного отрицательного отбора, отсеивающего вредные мутации, явно недостаточно для того, чтобы объяснить медленную эволюцию древних белков. Предположение о том, что каждая аминокислота, стоящая в данной позиции, влияет на приспособленность одинаковым образом независимо от «контекста» (т. е. от того, какие аминокислоты стоят в других позициях в том же белке или в других белках, взаимодействующих с ним), соответствует представлению о легкопроходимом ландшафте приспособленности (см. рисунок ниже). Но со времен LUCA в каждом синонимичном сайте (так называют те нуклеотиды в цепи ДНК, изменение которых не влияет на структуру кодируемого белка) произошло уже свыше 100 замен. Синонимичные нуклеотидные замены – это пример движения по ровным горизонтальным поверхностям ландшафта приспособленности. Из этого следует, что в случае хорошей проходимости ландшафта изучаемые белки давным-давно должны были освоить всю потенциально доступную им область в пространстве последовательностей, и тогда мы не наблюдали бы их продолжающегося расхождения.