Реконструкция предковой последовательности ( ASR ) – также известная как реконструкция предковой последовательности гена / последовательности / воскрешение – это метод, используемый в изучении молекулярной эволюции . Метод использует родственные последовательности для реконструкции «предкового» гена из множественного выравнивания последовательностей . [1]
Метод может быть использован для «воскрешения» предковых белков и был предложен в 1963 году Линусом Полингом и Эмилем Цукеркандлом . [2] В случае ферментов этот подход был назван палеоэнзимологией (англ. palaeoenzymology). Некоторые ранние попытки были предприняты в 1980-х и 1990-х годах под руководством лаборатории Стивена А. Беннера , показав потенциал этого метода. [3] Благодаря улучшению алгоритмов и лучшим методам секвенирования и синтеза, метод был дополнительно разработан в начале 2000-х годов, чтобы позволить воскрешать большее разнообразие и гораздо более древних генов. [4] За последнее десятилетие воскрешение предковых белков развилось как стратегия для выявления механизмов и динамики эволюции белков. [5]
В отличие от традиционных эволюционных и биохимических подходов к изучению белков, т. е. так называемого горизонтального сравнения родственных гомологов белков с разных концов ветвей древа жизни ; ASR исследует статистически выведенные предковые белки в узлах дерева — вертикально ( см. диаграмму справа). Этот подход дает доступ к свойствам белка, которые могли временно возникнуть в течение эволюционного времени, и недавно использовался как способ вывести потенциальное давление отбора , которое привело к современным последовательностям. ASR использовался для исследования причинной мутации, которая привела к неофункционализации белка после дупликации, путем первого определения того, что указанная мутация была расположена между предками «5» и «4» на диаграмме (иллюстративно) с использованием функциональных анализов. [6] В области биофизики белков ASR также использовался для изучения развития термодинамических и кинетических ландшафтов белка в течение эволюционного времени, а также путей сворачивания белка путем объединения многих современных аналитических методов, таких как HX/MS . [7] Такого рода идеи обычно выводятся из нескольких предков, реконструированных вдоль филогении – ссылаясь на предыдущую аналогию, путем изучения узлов все выше и выше (все дальше и дальше назад в эволюционном времени) в пределах древа жизни. [8]
Большинство исследований ASR проводятся in vitro и выявили свойства предковых белков, которые кажутся эволюционно желательными чертами, такими как повышенная термостабильность, каталитическая активность и каталитическая беспорядочность. Эти данные были аккредитованы артефактами алгоритмов ASR, а также показательными иллюстрациями древней среды Земли — часто исследования ASR должны быть дополнены обширным контролем (обычно альтернативными экспериментами ASR) для смягчения алгоритмической ошибки. Не все изученные белки ASR демонстрируют это так называемое «предковое превосходство». [9] Зарождающаяся область « эволюционной биохимии » была подкреплена недавним ростом исследований ASR, использующих предков в качестве способов исследования приспособленности организмов в определенных клеточных контекстах — эффективное тестирование предковых белков in vivo . [8] Из-за присущих этому виду исследований ограничений — в первую очередь из-за отсутствия достаточно древних геномов, чтобы вписать этих предков, небольшого репертуара хорошо классифицированных лабораторных модельных систем и невозможности имитировать древнюю клеточную среду, было проведено очень мало исследований ASR in vivo . Несмотря на вышеупомянутые препятствия, предварительные сведения об этом направлении исследований из статьи 2015 года показали, что наблюдаемое «превосходство предков» in vitro не было воспроизведено in vivo данного белка. [10] ASR представляет собой один из немногих механизмов для изучения биохимии докембрийской эры жизни (> 541 млн лет назад) и, следовательно, часто используется в « палеогенетике »; действительно, Цукеркандль и Полинг изначально предполагали, что ASR станет отправной точкой области, которую они назвали «палеобиохимией».
Несколько родственных гомологов интересующего белка выбираются и выравниваются в множественном выравнивании последовательностей (MSA), строится « филогенетическое дерево » со статистически выведенными последовательностями в узлах ветвей. Именно эти последовательности являются так называемыми «предками» — процесс синтеза соответствующей ДНК, превращения ее в клетку и получения белка является так называемой «реконструкцией». Предковые последовательности обычно вычисляются методом максимального правдоподобия , однако также применяются байесовские методы. Поскольку предки выводятся из филогении, топология и состав филогении играют важную роль в выходных последовательностях ASR. Учитывая, что существует много дискуссий и споров о том, как строить филогении — например, являются ли термофильные бактерии базальными или производными в эволюции бактерий, — во многих работах по ASR строится несколько филогений с различной топологией и, следовательно, с различными последовательностями ASR. Затем эти последовательности сравниваются, и часто несколько (~10) экспрессируются и изучаются на филогенетический узел. ASR не претендует на воссоздание фактической последовательности древнего белка/ДНК, а скорее последовательности, которая, вероятно, будет похожа на ту, которая действительно была в узле. Это не считается недостатком ASR, поскольку она вписывается в модель « нейтральной сети » эволюции белка, в которой в эволюционных узлах (узлах) популяция генотипически различных, но фенотипически похожих последовательностей белка существовала в существующей популяции организмов. Следовательно, возможно, что ASR сгенерирует одну из последовательностей нейтральной сети узла, и хотя она может не представлять генотип последнего общего предка современных последовательностей, она, вероятно, представляет фенотип. [8] Это подтверждается современным наблюдением, что многие мутации в некаталитическом/функциональном сайте белка вызывают незначительные изменения биофизических свойств. Таким образом, ASR позволяет исследовать биофизические свойства белков прошлого и свидетельствует о древней генетике.
Методы максимального правдоподобия (ML) работают путем генерации последовательности, где остаток в каждой позиции, как предсказывают, с наибольшей вероятностью займет указанную позицию с помощью используемого метода вывода — обычно это матрица оценок (похожая на те, что используются в BLAST или MSA), рассчитанная на основе существующих последовательностей. Альтернативные методы включают максимальную экономию (MP), которая строит последовательность на основе модели эволюции последовательности — обычно идея о том, что минимальное количество изменений нуклеотидной последовательности представляет собой наиболее эффективный путь эволюции и по бритве Оккама является наиболее вероятным. MP часто считается наименее надежным методом реконструкции, поскольку он, возможно, упрощает эволюцию до степени, которая неприменима в масштабе миллиардов лет.
Другой метод предполагает рассмотрение неопределенности остатков – так называемые байесовские методы – эта форма ASR иногда используется для дополнения методов ML, но обычно производит более неоднозначные последовательности. В ASR термин «неоднозначность» относится к позициям остатков, где нельзя предсказать четкую замену – часто в этих случаях производятся несколько последовательностей ASR, охватывающих большинство неоднозначностей и сравниваемых друг с другом. ML ASR часто нуждается в дополнительных экспериментах, чтобы указать, что полученные последовательности являются чем-то большим, чем просто консенсусы входных последовательностей. Это особенно необходимо при наблюдении «Предкового превосходства». [7] В тенденции к повышению термостабильности одно из объяснений заключается в том, что ML ASR создает консенсусную последовательность нескольких различных параллельных механизмов, эволюционировавших для придания незначительной термостабильности белка на протяжении филогении – что приводит к аддитивному эффекту, приводящему к «превосходящей» предковой термостабильности. [11]
Выражение консенсусных последовательностей и параллельного ASR через не-ML методы часто требуется для того, чтобы распустить эту теорию в каждом эксперименте. Еще одна проблема, поднятая методами ML, заключается в том, что матрицы оценок получены из современных последовательностей, и конкретные частоты аминокислот, наблюдаемые сегодня, могут не быть такими же, как в докембрийской биологии, что приводит к искаженному выводу о последовательности. Несколько исследований пытались построить древние матрицы оценок с помощью различных методологий и сравнили полученные последовательности и биофизические свойства их белков. Хотя эти измененные последовательности приводят к несколько иным последовательностям ASR, наблюдаемые биофизические свойства, по-видимому, не изменялись за пределами экспериментальной ошибки. [12] Из-за «целостной» природы ASR и большой сложности, которая возникает, когда мы рассматриваем все возможные источники экспериментальной ошибки, экспериментальное сообщество считает, что окончательное измерение надежности ASR — это сравнение нескольких альтернативных реконструкций ASR одного и того же узла и идентификация схожих биофизических свойств. Хотя этот метод не предлагает надежной статистической, математической меры надежности, он основывается на фундаментальной идее, используемой в ASR, о том, что отдельные замены аминокислот не вызывают значительных изменений биофизических свойств белка — положение, которое должно соблюдаться, чтобы иметь возможность преодолеть эффект неоднозначности вывода. [13]
Кандидаты, используемые для ASR, часто выбираются на основе конкретного изучаемого свойства, например, термостабильности. [9] Выбирая последовательности с любого конца диапазона свойств (например, психрофильные белки и термофильные белки), но в пределах семейства белков, ASR можно использовать для исследования конкретных изменений последовательностей, которые давали наблюдаемый биофизический эффект, такой как стабилизирующие взаимодействия. Рассмотрим на диаграмме, если последовательность «A» кодировала белок, который был оптимально функционален при нейтральных значениях pH, а «D» — в кислых условиях, то изменения последовательностей между «5» и «2» могут иллюстрировать точное биофизическое объяснение этого различия. Поскольку эксперименты с ASR могут извлекать предков, которым, вероятно, миллиарды лет, часто существуют десятки, если не сотни изменений последовательностей между самими предками и предками и существующими последовательностями — из-за этого такие эволюционные исследования функции последовательности могут потребовать много работы и рационального направления. [1] [6] [14]
Существует множество примеров предковых белков, которые были реконструированы с помощью вычислений, экспрессированы в живых клеточных линиях и — во многих случаях — очищены и биохимически изучены.
Другие примеры включают предковые зрительные пигменты позвоночных, [19] ферменты дрожжей, которые расщепляют сахара (800 млн лет назад); [20] ферменты бактерий , которые обеспечивают устойчивость к антибиотикам (2–3 млрд лет назад ); [21] рибонуклеазы, участвующие в пищеварении жвачных животных; алкогольдегидрогеназы (АДГ), участвующие в дрожжевой ферментации (~85 млн лет назад); [13] и Рубиско у пасленовых . [22]
«Возраст» реконструированной последовательности определяется с помощью модели молекулярных часов , и часто используется несколько. [7] [23] Этот метод датирования часто калибруется с использованием геологических временных точек (таких как древние океанические составляющие или BIF ), и хотя эти часы предлагают единственный метод выведения возраста очень древнего белка, они имеют огромные погрешности и их трудно защитить от противоположных данных. С этой целью «возраст» ASR на самом деле должен использоваться только как показательный признак и часто полностью превосходится для измерения количества замен между предковой и современной последовательностями (фундамент, на котором рассчитываются часы). [9] При этом использование часов позволяет сравнивать наблюдаемые биофизические данные белка ASR с геологической или экологической средой в то время. Например, исследования ASR на бактериальных EF-Tus (белки, участвующие в трансляции , которые, вероятно, редко подвергаются горизонтальному переносу и обычно демонстрируют Tms ~2C выше, чем Tenv) указывают на более горячую докембрийскую Землю, что очень близко соответствует геологическим данным о температурах древнего земного океана, основанным на уровнях изотопа кислорода-18 . [12] Исследования ASR дрожжевых Adhs показывают, что возникновение субфункционализированных Adhs для метаболизма этанола (а не только выделения отходов) возникло во время, схожее с рассветом мясистых фруктов в кембрийский период, и что до этого появления Adh служил для выделения этанола в качестве побочного продукта избытка пирувата . [13] Использование часов также, возможно, указывает на то, что зарождение жизни произошло до того, как указывают самые ранние молекулярные окаменелости (>4,1 млрд лет назад), но, учитывая спорную надежность молекулярных часов, к таким наблюдениям следует относиться с осторожностью. [23] [24]
Одним из примеров является реконструкция ферментов тиоредоксина из организмов возрастом до 4 миллиардов лет. [25] В то время как химическая активность этих реконструированных ферментов была удивительно похожа на современные ферменты, их физические свойства показали значительно повышенную термическую и кислотную стабильность. Эти результаты были интерпретированы как предположение о том, что древняя жизнь могла развиться в океанах, которые были намного горячее и кислее, чем сегодня. [25]
Эти эксперименты затрагивают различные важные вопросы эволюционной биологии: происходит ли эволюция маленькими шагами или большими скачками; обратима ли эволюция; как эволюционирует сложность ? Было показано, что небольшие мутации в аминокислотной последовательности гормональных рецепторов определяют важное изменение их предпочтений в отношении гормонов. Эти изменения означают огромные шаги в эволюции эндокринной системы . Таким образом, очень небольшие изменения на молекулярном уровне могут иметь огромные последствия. Лаборатория Торнтона также смогла показать, что эволюция необратима, изучая глюкокортикоидный рецептор . Этот рецептор был изменен семью мутациями в рецепторе кортизола, но обращение этих мутаций не вернуло исходный рецептор. Указывая на то, что эпистаз играет важную роль в эволюции белка — наблюдение, которое в сочетании с наблюдениями нескольких примеров параллельной эволюции подтверждает упомянутую выше модель нейтральной сети. [8] Другие более ранние нейтральные мутации действовали как храповик и делали изменения в рецепторе необратимыми. [26] Эти различные эксперименты с рецепторами показывают, что в ходе своей эволюции белки сильно дифференцировались, и это объясняет, как может развиваться сложность. Более пристальный взгляд на различные предковые гормональные рецепторы и различные гормоны показывает, что на уровне взаимодействия между отдельными аминокислотными остатками и химическими группами гормонов возникают очень небольшие, но специфические изменения. Знание этих изменений может, например, привести к синтезу гормональных эквивалентов, способных имитировать или ингибировать действие гормона, что может открыть возможности для новых методов лечения.
Учитывая, что ASR выявил тенденцию к древней термостабильности и ферментативной неразборчивости, ASR представляет собой ценный инструмент для белковых инженеров , которые часто желают получить эти черты (производя эффекты, иногда превосходящие современные рационально управляемые инструменты). [11] ASR также обещает «воскресить» фенотипически похожие «древние организмы», что, в свою очередь, позволит эволюционным биохимикам исследовать историю жизни. Сторонники ASR, такие как Беннер, утверждают, что благодаря этим и другим экспериментам к концу текущего столетия мы увидим уровень понимания в биологии, аналогичный тому, который возник в классической химии в прошлом веке. [13]