Реконструкция предковой последовательности

Использование родственных последовательностей для построения гена, похожего на предков

Реконструкция предковой последовательности ( ASR ) – также известная как реконструкция предковой последовательности гена / последовательности / воскрешение – это метод, используемый в изучении молекулярной эволюции . Метод использует родственные последовательности для реконструкции «предкового» гена из множественного выравнивания последовательностей . [1]

Метод может быть использован для «воскрешения» предковых белков и был предложен в 1963 году Линусом Полингом и Эмилем Цукеркандлом . [2] В случае ферментов этот подход был назван палеоэнзимологией (англ. palaeoenzymology). Некоторые ранние попытки были предприняты в 1980-х и 1990-х годах под руководством лаборатории Стивена А. Беннера , показав потенциал этого метода. [3] Благодаря улучшению алгоритмов и лучшим методам секвенирования и синтеза, метод был дополнительно разработан в начале 2000-х годов, чтобы позволить воскрешать большее разнообразие и гораздо более древних генов. [4] За последнее десятилетие воскрешение предковых белков развилось как стратегия для выявления механизмов и динамики эволюции белков. [5]

Принципы

Иллюстрация филогенетического дерева и его роли в концептуализации проведения ASR.
Алгоритм реконструкции предковых последовательностей 1,2 и 3 (со ссылкой на рисунок выше). Предковая последовательность последовательности 1 может быть реконструирована из B и C, если доступна хотя бы одна внешняя группа, например D или E. Например, последовательности B и C различаются в позиции 4, но поскольку последовательности D и E имеют C в этой позиции, последовательность 1, скорее всего, также имела C. Последовательность 3 не может быть полностью реконструирована без дополнительной внешней группы (неопределенность обозначена «X»).

В отличие от традиционных эволюционных и биохимических подходов к изучению белков, т. е. так называемого горизонтального сравнения родственных гомологов белков с разных концов ветвей древа жизни ; ASR исследует статистически выведенные предковые белки в узлах дерева — вертикально ( см. диаграмму справа). Этот подход дает доступ к свойствам белка, которые могли временно возникнуть в течение эволюционного времени, и недавно использовался как способ вывести потенциальное давление отбора , которое привело к современным последовательностям. ASR использовался для исследования причинной мутации, которая привела к неофункционализации белка после дупликации, путем первого определения того, что указанная мутация была расположена между предками «5» и «4» на диаграмме (иллюстративно) с использованием функциональных анализов. [6] В области биофизики белков ASR также использовался для изучения развития термодинамических и кинетических ландшафтов белка в течение эволюционного времени, а также путей сворачивания белка путем объединения многих современных аналитических методов, таких как HX/MS . [7] Такого рода идеи обычно выводятся из нескольких предков, реконструированных вдоль филогении – ссылаясь на предыдущую аналогию, путем изучения узлов все выше и выше (все дальше и дальше назад в эволюционном времени) в пределах древа жизни. [8]

Большинство исследований ASR проводятся in vitro и выявили свойства предковых белков, которые кажутся эволюционно желательными чертами, такими как повышенная термостабильность, каталитическая активность и каталитическая беспорядочность. Эти данные были аккредитованы артефактами алгоритмов ASR, а также показательными иллюстрациями древней среды Земли — часто исследования ASR должны быть дополнены обширным контролем (обычно альтернативными экспериментами ASR) для смягчения алгоритмической ошибки. Не все изученные белки ASR демонстрируют это так называемое «предковое превосходство». [9] Зарождающаяся область « эволюционной биохимии » была подкреплена недавним ростом исследований ASR, использующих предков в качестве способов исследования приспособленности организмов в определенных клеточных контекстах — эффективное тестирование предковых белков in vivo . [8] Из-за присущих этому виду исследований ограничений — в первую очередь из-за отсутствия достаточно древних геномов, чтобы вписать этих предков, небольшого репертуара хорошо классифицированных лабораторных модельных систем и невозможности имитировать древнюю клеточную среду, было проведено очень мало исследований ASR in vivo . Несмотря на вышеупомянутые препятствия, предварительные сведения об этом направлении исследований из статьи 2015 года показали, что наблюдаемое «превосходство предков» in vitro не было воспроизведено in vivo данного белка. [10] ASR представляет собой один из немногих механизмов для изучения биохимии докембрийской эры жизни (> 541 млн лет назад) и, следовательно, часто используется в « палеогенетике »; действительно, Цукеркандль и Полинг изначально предполагали, что ASR станет отправной точкой области, которую они назвали «палеобиохимией».

Методология

Несколько родственных гомологов интересующего белка выбираются и выравниваются в множественном выравнивании последовательностей (MSA), строится « филогенетическое дерево » со статистически выведенными последовательностями в узлах ветвей. Именно эти последовательности являются так называемыми «предками» — процесс синтеза соответствующей ДНК, превращения ее в клетку и получения белка является так называемой «реконструкцией». Предковые последовательности обычно вычисляются методом максимального правдоподобия , однако также применяются байесовские методы. Поскольку предки выводятся из филогении, топология и состав филогении играют важную роль в выходных последовательностях ASR. Учитывая, что существует много дискуссий и споров о том, как строить филогении — например, являются ли термофильные бактерии базальными или производными в эволюции бактерий, — во многих работах по ASR строится несколько филогений с различной топологией и, следовательно, с различными последовательностями ASR. Затем эти последовательности сравниваются, и часто несколько (~10) экспрессируются и изучаются на филогенетический узел. ASR не претендует на воссоздание фактической последовательности древнего белка/ДНК, а скорее последовательности, которая, вероятно, будет похожа на ту, которая действительно была в узле. Это не считается недостатком ASR, поскольку она вписывается в модель « нейтральной сети » эволюции белка, в которой в эволюционных узлах (узлах) популяция генотипически различных, но фенотипически похожих последовательностей белка существовала в существующей популяции организмов. Следовательно, возможно, что ASR сгенерирует одну из последовательностей нейтральной сети узла, и хотя она может не представлять генотип последнего общего предка современных последовательностей, она, вероятно, представляет фенотип. [8] Это подтверждается современным наблюдением, что многие мутации в некаталитическом/функциональном сайте белка вызывают незначительные изменения биофизических свойств. Таким образом, ASR позволяет исследовать биофизические свойства белков прошлого и свидетельствует о древней генетике.

Методы максимального правдоподобия (ML) работают путем генерации последовательности, где остаток в каждой позиции, как предсказывают, с наибольшей вероятностью займет указанную позицию с помощью используемого метода вывода — обычно это матрица оценок (похожая на те, что используются в BLAST или MSA), рассчитанная на основе существующих последовательностей. Альтернативные методы включают максимальную экономию (MP), которая строит последовательность на основе модели эволюции последовательности — обычно идея о том, что минимальное количество изменений нуклеотидной последовательности представляет собой наиболее эффективный путь эволюции и по бритве Оккама является наиболее вероятным. MP часто считается наименее надежным методом реконструкции, поскольку он, возможно, упрощает эволюцию до степени, которая неприменима в масштабе миллиардов лет.

Другой метод предполагает рассмотрение неопределенности остатков – так называемые байесовские методы – эта форма ASR иногда используется для дополнения методов ML, но обычно производит более неоднозначные последовательности. В ASR термин «неоднозначность» относится к позициям остатков, где нельзя предсказать четкую замену – часто в этих случаях производятся несколько последовательностей ASR, охватывающих большинство неоднозначностей и сравниваемых друг с другом. ML ASR часто нуждается в дополнительных экспериментах, чтобы указать, что полученные последовательности являются чем-то большим, чем просто консенсусы входных последовательностей. Это особенно необходимо при наблюдении «Предкового превосходства». [7] В тенденции к повышению термостабильности одно из объяснений заключается в том, что ML ASR создает консенсусную последовательность нескольких различных параллельных механизмов, эволюционировавших для придания незначительной термостабильности белка на протяжении филогении – что приводит к аддитивному эффекту, приводящему к «превосходящей» предковой термостабильности. [11]

Выражение консенсусных последовательностей и параллельного ASR через не-ML методы часто требуется для того, чтобы распустить эту теорию в каждом эксперименте. Еще одна проблема, поднятая методами ML, заключается в том, что матрицы оценок получены из современных последовательностей, и конкретные частоты аминокислот, наблюдаемые сегодня, могут не быть такими же, как в докембрийской биологии, что приводит к искаженному выводу о последовательности. Несколько исследований пытались построить древние матрицы оценок с помощью различных методологий и сравнили полученные последовательности и биофизические свойства их белков. Хотя эти измененные последовательности приводят к несколько иным последовательностям ASR, наблюдаемые биофизические свойства, по-видимому, не изменялись за пределами экспериментальной ошибки. [12] Из-за «целостной» природы ASR и большой сложности, которая возникает, когда мы рассматриваем все возможные источники экспериментальной ошибки, экспериментальное сообщество считает, что окончательное измерение надежности ASR — это сравнение нескольких альтернативных реконструкций ASR одного и того же узла и идентификация схожих биофизических свойств. Хотя этот метод не предлагает надежной статистической, математической меры надежности, он основывается на фундаментальной идее, используемой в ASR, о том, что отдельные замены аминокислот не вызывают значительных изменений биофизических свойств белка — положение, которое должно соблюдаться, чтобы иметь возможность преодолеть эффект неоднозначности вывода. [13]

Кандидаты, используемые для ASR, часто выбираются на основе конкретного изучаемого свойства, например, термостабильности. [9] Выбирая последовательности с любого конца диапазона свойств (например, психрофильные белки и термофильные белки), но в пределах семейства белков, ASR можно использовать для исследования конкретных изменений последовательностей, которые давали наблюдаемый биофизический эффект, такой как стабилизирующие взаимодействия. Рассмотрим на диаграмме, если последовательность «A» кодировала белок, который был оптимально функционален при нейтральных значениях pH, а «D» — в кислых условиях, то изменения последовательностей между «5» и «2» могут иллюстрировать точное биофизическое объяснение этого различия. Поскольку эксперименты с ASR могут извлекать предков, которым, вероятно, миллиарды лет, часто существуют десятки, если не сотни изменений последовательностей между самими предками и предками и существующими последовательностями — из-за этого такие эволюционные исследования функции последовательности могут потребовать много работы и рационального направления. [1] [6] [14]

Воскресшие белки

Существует множество примеров предковых белков, которые были реконструированы с помощью вычислений, экспрессированы в живых клеточных линиях и — во многих случаях — очищены и биохимически изучены.

  • В частности, лаборатория Торнтона возродила несколько древних гормональных рецепторов (возрастом около 500 млн лет) [4] [15] [16] и сотрудничала с лабораторией Стивенса с целью возродить древние субъединицы V-АТФазы [17] из дрожжей (возрастом около 800 млн лет).
  • Недавно лаборатория Маркузи опубликовала несколько исследований, касающихся эволюционной биофизической истории рибонуклеазы H1 E. coli . [9] [18]

Другие примеры включают предковые зрительные пигменты позвоночных, [19] ферменты дрожжей, которые расщепляют сахара (800 млн лет назад); [20] ферменты бактерий , которые обеспечивают устойчивость к антибиотикам (2–3 млрд лет назад ); [21] рибонуклеазы, участвующие в пищеварении жвачных животных; алкогольдегидрогеназы (АДГ), участвующие в дрожжевой ферментации (~85 млн лет назад); [13] и Рубиско у пасленовых . [22]

«Возраст» реконструированной последовательности определяется с помощью модели молекулярных часов , и часто используется несколько. [7] [23] Этот метод датирования часто калибруется с использованием геологических временных точек (таких как древние океанические составляющие или BIF ), и хотя эти часы предлагают единственный метод выведения возраста очень древнего белка, они имеют огромные погрешности и их трудно защитить от противоположных данных. С этой целью «возраст» ASR на самом деле должен использоваться только как показательный признак и часто полностью превосходится для измерения количества замен между предковой и современной последовательностями (фундамент, на котором рассчитываются часы). [9] При этом использование часов позволяет сравнивать наблюдаемые биофизические данные белка ASR с геологической или экологической средой в то время. Например, исследования ASR на бактериальных EF-Tus (белки, участвующие в трансляции , которые, вероятно, редко подвергаются горизонтальному переносу и обычно демонстрируют Tms ~2C выше, чем Tenv) указывают на более горячую докембрийскую Землю, что очень близко соответствует геологическим данным о температурах древнего земного океана, основанным на уровнях изотопа кислорода-18 . [12] Исследования ASR дрожжевых Adhs показывают, что возникновение субфункционализированных Adhs для метаболизма этанола (а не только выделения отходов) возникло во время, схожее с рассветом мясистых фруктов в кембрийский период, и что до этого появления Adh служил для выделения этанола в качестве побочного продукта избытка пирувата . [13] Использование часов также, возможно, указывает на то, что зарождение жизни произошло до того, как указывают самые ранние молекулярные окаменелости (>4,1 млрд лет назад), но, учитывая спорную надежность молекулярных часов, к таким наблюдениям следует относиться с осторожностью. [23] [24]

Тиоредоксин

Одним из примеров является реконструкция ферментов тиоредоксина из организмов возрастом до 4 миллиардов лет. [25] В то время как химическая активность этих реконструированных ферментов была удивительно похожа на современные ферменты, их физические свойства показали значительно повышенную термическую и кислотную стабильность. Эти результаты были интерпретированы как предположение о том, что древняя жизнь могла развиться в океанах, которые были намного горячее и кислее, чем сегодня. [25]

Значение

Эти эксперименты затрагивают различные важные вопросы эволюционной биологии: происходит ли эволюция маленькими шагами или большими скачками; обратима ли эволюция; как эволюционирует сложность ? Было показано, что небольшие мутации в аминокислотной последовательности гормональных рецепторов определяют важное изменение их предпочтений в отношении гормонов. Эти изменения означают огромные шаги в эволюции эндокринной системы . Таким образом, очень небольшие изменения на молекулярном уровне могут иметь огромные последствия. Лаборатория Торнтона также смогла показать, что эволюция необратима, изучая глюкокортикоидный рецептор . Этот рецептор был изменен семью мутациями в рецепторе кортизола, но обращение этих мутаций не вернуло исходный рецептор. Указывая на то, что эпистаз играет важную роль в эволюции белка — наблюдение, которое в сочетании с наблюдениями нескольких примеров параллельной эволюции подтверждает упомянутую выше модель нейтральной сети. [8] Другие более ранние нейтральные мутации действовали как храповик и делали изменения в рецепторе необратимыми. [26] Эти различные эксперименты с рецепторами показывают, что в ходе своей эволюции белки сильно дифференцировались, и это объясняет, как может развиваться сложность. Более пристальный взгляд на различные предковые гормональные рецепторы и различные гормоны показывает, что на уровне взаимодействия между отдельными аминокислотными остатками и химическими группами гормонов возникают очень небольшие, но специфические изменения. Знание этих изменений может, например, привести к синтезу гормональных эквивалентов, способных имитировать или ингибировать действие гормона, что может открыть возможности для новых методов лечения.

Учитывая, что ASR выявил тенденцию к древней термостабильности и ферментативной неразборчивости, ASR представляет собой ценный инструмент для белковых инженеров , которые часто желают получить эти черты (производя эффекты, иногда превосходящие современные рационально управляемые инструменты). [11] ASR также обещает «воскресить» фенотипически похожие «древние организмы», что, в свою очередь, позволит эволюционным биохимикам исследовать историю жизни. Сторонники ASR, такие как Беннер, утверждают, что благодаря этим и другим экспериментам к концу текущего столетия мы увидим уровень понимания в биологии, аналогичный тому, который возник в классической химии в прошлом веке. [13]

Ссылки

  1. ^ ab Thornton JW (май 2004 г.). «Воскрешение древних генов: экспериментальный анализ вымерших молекул». Nature Reviews. Genetics . 5 (5): 366–375 . doi :10.1038/nrg1324. PMID  15143319. S2CID  205482979.
  2. ^ Полинг Л., Цукеркандл Э. (1963). «Химическая палеогенетика: молекулярные восстановительные исследования вымерших форм жизни». Acta Chemica Scandinavica . 17 : S9 – S16 . ]
  3. ^ Jermann TM, Opitz JG, Stackhouse J, Benner SA (март 1995 г.). «Реконструкция эволюционной истории суперсемейства рибонуклеаз парнокопытных». Nature . 374 (6517): 57– 59. Bibcode :1995Natur.374...57J. doi :10.1038/374057a0. PMID  7532788. S2CID  4315312.
  4. ^ ab Thornton JW, Need E, Crews D (сентябрь 2003 г.). «Воскрешение предкового стероидного рецептора: древнее происхождение сигнализации эстрогена». Science . 301 (5640): 1714– 1717. Bibcode :2003Sci...301.1714T. doi :10.1126/science.1086185. PMID  14500980. S2CID  37628350.
  5. ^ Pearson H (март 2012). «Доисторические белки: воскрешение мертвых». Nature . 483 (7390). London: 390– 3. Bibcode : 2012Natur.483..390P. doi : 10.1038/483390a . PMID  22437590.
  6. ^ ab Anderson DP, Whitney DS, Hanson-Smith V, Woznica A, Campodonico-Burnett W, Volkman BF и др. (январь 2016 г.). «Эволюция древней функции белка, участвующей в организованной многоклеточности у животных». eLife . 5 : e10147. doi : 10.7554/eLife.10147 . PMC 4718807 . PMID  26740169. 
  7. ^ abc Wheeler LC, Lim SA, Marqusee S, Harms MJ (июнь 2016 г.). «Термостабильность и специфичность древних белков». Current Opinion in Structural Biology . 38 : 37–43 . doi :10.1016/j.sbi.2016.05.015. PMC 5010474. PMID  27288744 . 
  8. ^ abcd Harms MJ, Thornton JW (август 2013 г.). «Эволюционная биохимия: выявление исторических и физических причин свойств белков». Nature Reviews. Genetics . 14 (8): 559– 571. doi :10.1038/nrg3540. PMC 4418793. PMID  23864121 . 
  9. ^ abcd Lim SA, Hart KM, Harms MJ, Marqusee S (ноябрь 2016 г.). «Эволюционная тенденция к кинетической стабильности в траектории сворачивания РНКаз H». Труды Национальной академии наук Соединенных Штатов Америки . 113 (46): 13045– 13050. Bibcode : 2016PNAS..11313045L. doi : 10.1073/pnas.1611781113 . PMC 5135364. PMID  27799545 . 
  10. ^ Hobbs JK, Prentice EJ, Groussin M, Arcus VL (октябрь 2015 г.). «Реконструированные предковые ферменты налагают стоимость приспособленности на современные бактерии, несмотря на демонстрацию благоприятных биохимических свойств». Journal of Molecular Evolution . 81 ( 3– 4): 110– 120. Bibcode :2015JMolE..81..110H. doi :10.1007/s00239-015-9697-5. hdl : 1721.1/105120 . PMID  26349578. S2CID  18833850.
  11. ^ ab Risso VA, Gavira JA, Sanchez-Ruiz JM (июнь 2014 г.). «Термостабильные и беспорядочные докембрийские белки». Environmental Microbiology . 16 (6): 1485– 1489. Bibcode : 2014EnvMi..16.1485R. doi : 10.1111/1462-2920.12319. hdl : 10481/87187 . PMID  25009840.
  12. ^ ab Gaucher EA, Govindarajan S, Ganesh OK (февраль 2008 г.). «Тенденция палеотемпературы для докембрийской жизни, выведенная из воскрешенных белков». Nature . 451 (7179): 704– 707. Bibcode :2008Natur.451..704G. doi :10.1038/nature06510. PMID  18256669. S2CID  4311053.
  13. ^ abcd Liberles DA, ред. (2007-07-26). Реконструкция родовой последовательности. Оксфорд, Нью-Йорк: Oxford University Press. ISBN 978-0-19-929918-8.
  14. ^ Рисунок 1 из ссылки Harms MJ, Thornton JW (август 2013 г.). «Эволюционная биохимия: выявление исторических и физических причин свойств белков». Nature Reviews. Genetics . 14 (8): 559– 571. doi :10.1038/nrg3540. PMC 4418793. PMID  23864121 . 
  15. ^ Eick GN, Colucci JK, Harms MJ, Ortlund EA, Thornton JW (2012). «Эволюция минимальной специфичности и промискуитета в рецепторах стероидных гормонов». PLOS Genetics . 8 (11): e1003072. doi : 10.1371/journal.pgen.1003072 . PMC 3499368. PMID  23166518 . 
  16. ^ Harms MJ, Eick GN, Goswami D, Colucci JK, Griffin PR, Ortlund EA, Thornton JW (июль 2013 г.). «Биофизические механизмы мутаций с большим эффектом в эволюции рецепторов стероидных гормонов». Труды Национальной академии наук Соединенных Штатов Америки . 110 (28): 11475– 80. Bibcode : 2013PNAS..11011475H. doi : 10.1073/pnas.1303930110 . PMC 3710831. PMID  23798447 . 
  17. ^ Finnigan GC, Hanson-Smith V, Stevens TH, Thornton JW (январь 2012 г.). «Эволюция повышенной сложности в молекулярной машине». Nature . 481 (7381): 360– 364. Bibcode :2012Natur.481..360F. doi :10.1038/nature10724. PMC 3979732 . PMID  22230956. 
  18. ^ Hart KM, Harms MJ, Schmidt BH, Elya C, Thornton JW, Marqusee S (ноябрь 2014 г.). «Дрейф термодинамической системы в эволюции белков». PLOS Biology . 12 (11): e1001994. doi : 10.1371/journal.pbio.1001994 . PMC 4227636. PMID  25386647 . 
  19. ^ Shi Y, Yokoyama S (июль 2003 г.). «Молекулярный анализ эволюционного значения ультрафиолетового зрения у позвоночных». Труды Национальной академии наук Соединенных Штатов Америки . 100 (14): 8308– 8313. Bibcode : 2003PNAS..100.8308S . doi : 10.1073/pnas.1532535100 . PMC 166225. PMID  12824471. 
  20. ^ Voordecers K, Brown CA, Vanneste K, van der Zande E, Voet A, Maere S, Verstrepen KJ (2012). «Реконструкция предковых метаболических ферментов раскрывает молекулярные механизмы, лежащие в основе эволюционных инноваций посредством дупликации генов». PLOS Biology . 10 (12): e1001446. doi : 10.1371/journal.pbio.1001446 . PMC 3519909. PMID  23239941. 
  21. ^ Risso VA, Gavira JA, Mejia-Carmona DF, Gaucher EA, Sanchez-Ruiz JM (февраль 2013 г.). «Гиперстабильность и субстратная неоднородность в лабораторных воскрешениях докембрийских β-лактамаз». Журнал Американского химического общества . 135 (8): 2899– 2902. doi : 10.1021/ja311630a. hdl : 11336/22624 . PMID  23394108. S2CID  207092445.
  22. ^ Лин, Майат Т.; Салихович, Хайди; Кларк, Фрэнсис К.; Хансон, Морин Р. (15 апреля 2022 г.). «Повышение эффективности Рубиско путем воскрешения его предков из семейства пасленовых». Science Advances . 8 (15): eabm6871. Bibcode : 2022SciA....8M6871L. doi : 10.1126/sciadv.abm6871 . PMC 9012466. PMID  35427154 . 
  23. ^ ab Battistuzzi FU, Feijao A, Hedges SB (ноябрь 2004 г.). «Геномная временная шкала эволюции прокариот: взгляд на происхождение метаногенеза, фототрофии и колонизации суши». BMC Evolutionary Biology . 4 : 44. doi : 10.1186/1471-2148-4-44 . PMC 533871. PMID  15535883 . 
  24. ^ Bell EA , Boehnke P, Harrison TM, Mao WL (ноябрь 2015 г.). «Потенциально биогенный углерод, сохранившийся в цирконе возрастом 4,1 миллиарда лет». Труды Национальной академии наук Соединенных Штатов Америки . 112 (47): 14518– 14521. Bibcode : 2015PNAS..11214518B. doi : 10.1073/pnas.1517557112 . PMC 4664351. PMID  26483481 . 
  25. ^ ab Perez-Jimenez R, Inglés-Prieto A, Zhao ZM, Sanchez-Romero I, Alegre-Cebollada J, Kosuri P, et al. (май 2011 г.). «Палеоэнзимология одиночных молекул исследует химию воскрешенных ферментов». Nature Structural & Molecular Biology . 18 (5): 592– 596. doi :10.1038/nsmb.2020. PMC 3087858 . PMID  21460845. 
  26. ^ Bridgham JT, Ortlund EA, Thornton JW (сентябрь 2009 г.). «Эпистатический храповик ограничивает направление эволюции глюкокортикоидных рецепторов». Nature . 461 (7263): 515– 519. Bibcode :2009Natur.461..515B. doi :10.1038/nature08249. PMC 6141187 . PMID  19779450. 
Взято с "https://en.wikipedia.org/w/index.php?title=Восстановление_последовательности_предков&oldid=1258362048"