Псевдогены — это нефункциональные сегменты ДНК , которые напоминают функциональные гены . Большинство из них возникают как избыточные копии функциональных генов, либо напрямую путем дупликации генов , либо косвенно путем обратной транскрипции транскрипта мРНК . Псевдогены обычно идентифицируются, когда анализ последовательности генома обнаруживает геноподобные последовательности, в которых отсутствуют регуляторные последовательности, необходимые для транскрипции или трансляции , или чьи кодирующие последовательности явно дефектны из-за сдвигов рамки считывания или преждевременных стоп-кодонов . Псевдогены — это тип мусорной ДНК .
Большинство небактериальных геномов содержат много псевдогенов, часто столько же, сколько и функциональных генов. Это неудивительно, поскольку ожидается, что различные биологические процессы будут случайно создавать псевдогены, и не существует специализированных механизмов для их удаления из геномов. В конечном итоге псевдогены могут быть удалены из их геномов случайно из-за ошибок репликации ДНК или репарации ДНК , или они могут накопить так много мутационных изменений, что их больше нельзя будет распознать как бывшие гены. Анализ этих событий дегенерации помогает прояснить эффекты неселективных процессов в геномах.
Последовательности псевдогенов могут транскрибироваться в РНК на низких уровнях из-за элементов промотора, унаследованных от гена предка или возникших в результате новых мутаций. Хотя большинство этих транскриптов не будут иметь большего функционального значения, чем случайные транскрипты из других частей генома, некоторые из них дали начало полезным регуляторным РНК и новым белкам.
В этом разделе отсутствует информация о более быстром накоплении мутации. ( Декабрь 2023 ) |
Псевдогены обычно характеризуются сочетанием сходства или гомологии с известным геном вместе с потерей некоторой функциональности. То есть, хотя каждый псевдоген имеет последовательность ДНК , которая похожа на какой-то функциональный ген, они обычно не способны производить функциональные конечные белковые продукты. [1] Псевдогены иногда трудно идентифицировать и характеризовать в геномах, потому что два требования сходства и потери функциональности обычно подразумеваются через выравнивание последовательностей, а не доказаны биологически.
Псевдогены для генов РНК обычно сложнее обнаружить, поскольку их не нужно транслировать, и, таким образом, у них нет «рамок считывания». Ряд псевдогенов рРНК были идентифицированы на основе изменений в концах массива рДНК. [2]
Псевдогены могут усложнять молекулярно-генетические исследования. Например, амплификация гена с помощью ПЦР может одновременно амплифицировать псевдоген, который разделяет схожие последовательности. Это известно как смещение ПЦР или смещение амплификации. Аналогично псевдогены иногда аннотируются как гены в последовательностях генома .
Обработанные псевдогены часто представляют проблему для программ предсказания генов , часто ошибочно идентифицируясь как настоящие гены или экзоны. Было высказано предположение, что идентификация обработанных псевдогенов может помочь повысить точность методов предсказания генов. [3]
В 2014 году было показано, что транслируются 140 человеческих псевдогенов. [4] Однако функция белковых продуктов, если таковая имеется, неизвестна.
Существует четыре основных типа псевдогенов, все с различными механизмами происхождения и характерными чертами. Классификации псевдогенов следующие:
У высших эукариот , особенно млекопитающих , ретротранспозиция является довольно распространенным событием, которое оказало огромное влияние на состав генома. Например, где-то от 30 до 44% человеческого генома состоит из повторяющихся элементов, таких как SINE и LINE (см. ретротранспозоны ). [7] [8] В процессе ретротранспозиции часть транскрипта мРНК или гнРНК гена спонтанно обратно транскрибируется обратно в ДНК и вставляется в хромосомную ДНК. Хотя ретротранспозоны обычно создают копии самих себя, в системе in vitro было показано , что они также могут создавать ретротранспонированные копии случайных генов. [9] После того, как эти псевдогены вставляются обратно в геном, они обычно содержат поли-А-хвост , и обычно их интроны вырезаются ; это обе отличительные черты кДНК . Однако, поскольку они получены из продукта РНК, обработанные псевдогены также не имеют восходящих промоутеров нормальных генов; таким образом, они считаются «мертвыми по прибытии», становясь нефункциональными псевдогенами сразу после события ретротранспозиции. [10] Однако эти вставки иногда вносят экзоны в существующие гены, обычно через альтернативно сплайсированные транскрипты. [11] Еще одной характеристикой обработанных псевдогенов является обычное усечение 5'-конца относительно родительской последовательности, что является результатом относительно непроцессивного механизма ретротранспозиции, который создает обработанные псевдогены. [12] Обработанные псевдогены постоянно создаются у приматов. [13] Например, человеческие популяции имеют различные наборы обработанных псевдогенов среди своих особей. [14]
Было показано, что обработанные псевдогены накапливают мутации быстрее, чем необработанные псевдогены. [15]
Дупликация генов — еще один распространенный и важный процесс в эволюции геномов. Копия функционального гена может возникнуть в результате события дупликации гена, вызванного гомологичной рекомбинацией , например, в повторяющихся последовательностях SINE на смещенных хромосомах, и впоследствии приобрести мутации , которые заставляют копию терять функцию исходного гена. Дуплицированные псевдогены обычно имеют все те же характеристики, что и гены, включая неповрежденную структуру экзон - интрона и регуляторные последовательности. Потеря функциональности дуплицированного гена обычно мало влияет на приспособленность организма , поскольку неповрежденная функциональная копия все еще существует. Согласно некоторым эволюционным моделям, общие дублированные псевдогены указывают на эволюционное родство людей и других приматов. [16] Если псевдогенизация вызвана дупликацией гена, она обычно происходит в первые несколько миллионов лет после дупликации гена, при условии, что ген не подвергался какому-либо давлению отбора . [17] Дупликация гена создает функциональную избыточность , и обычно невыгодно нести два идентичных гена. Мутации, которые нарушают либо структуру, либо функцию любого из двух генов, не являются вредными и не будут удалены в процессе отбора. В результате мутировавший ген постепенно становится псевдогеном и будет либо невыраженным, либо бесфункциональным. Такого рода эволюционная судьба показана с помощью популяционного генетического моделирования [18] [19] , а также геномного анализа . [17] [20] Согласно эволюционному контексту, эти псевдогены будут либо удалены, либо станут настолько отличными от родительских генов, что их больше нельзя будет идентифицировать. Относительно молодые псевдогены можно распознать благодаря сходству их последовательностей. [21]
Различные мутации (такие как индели и бессмысленные мутации ) могут помешать гену нормально транскрибироваться или транслироваться , и, таким образом, ген может стать менее- или нефункциональным или «дезактивированным». Это те же механизмы, посредством которых необработанные гены становятся псевдогенами, но разница в этом случае заключается в том, что ген не был дублирован до псевдогенизации. Обычно такой псевдоген вряд ли закрепится в популяции, но различные популяционные эффекты, такие как генетический дрейф , бутылочное горлышко популяции или, в некоторых случаях, естественный отбор , могут привести к фиксации. Классическим примером унитарного псевдогена является ген, который предположительно кодирует фермент L-гулоно-γ-лактоноксидазу (GULO) у приматов. У всех изученных млекопитающих, кроме приматов (кроме морских свинок), GULO помогает в биосинтезе аскорбиновой кислоты (витамина С), но он существует как отключенный ген (GULOP) у людей и других приматов. [22] [23] Другой более недавний пример неработающего гена связывает деактивацию гена каспазы 12 (через бессмысленную мутацию ) с положительным отбором у людей. [24]
Хотя подавляющее большинство псевдогенов утратили свою функцию, появились некоторые случаи, в которых псевдоген либо восстановил свою первоначальную или похожую функцию, либо развил новую функцию. В геноме человека было выявлено несколько примеров, которые изначально были классифицированы как псевдогены, но позже было обнаружено, что они имеют функциональную, хотя и не обязательно кодирующую белок, роль. [25] [26]
Вот несколько примеров:
Быстрое распространение технологий секвенирования ДНК привело к идентификации многих очевидных псевдогенов с использованием методов предсказания генов . Псевдогены часто идентифицируются по появлению преждевременного стоп-кодона в предсказанной последовательности мРНК, что, теоретически, должно было бы предотвратить синтез ( трансляцию ) нормального белкового продукта исходного гена. Были некоторые сообщения о трансляционном считывании таких преждевременных стоп-кодонов у млекопитающих. Как указано на рисунке выше, небольшое количество белкового продукта такого считывания все еще может быть распознаваемым и функционировать на каком-то уровне. Если это так, псевдоген может быть подвергнут естественному отбору . Это, по-видимому, произошло во время эволюции видов Drosophila .
В 2016 году было сообщено, что четыре предсказанных псевдогена в нескольких видах Drosophila на самом деле кодируют белки с биологически важными функциями, [27] «предполагая, что такие «псевдопсевдогены» могут представлять собой широко распространенное явление». Например, функциональный белок ( обонятельный рецептор глутамата ) из гена Ir75a обнаружен только в нейронах . Это обнаружение тканеспецифичных биологически-функциональных генов, которые могли бы быть классифицированы как псевдогены с помощью анализа in silico, усложняет анализ данных о последовательностях. [27] Другим псевдопсевдогеном Drosophila является jingwei , [28] [29] , который кодирует функциональный фермент алкогольдегидрогеназу in vivo . [30]
По состоянию на 2012 год, в геноме человека насчитывается около 12 000–14 000 псевдогенов. [31] Протеогеномный анализ 2016 года с использованием масс-спектрометрии пептидов выявил по меньшей мере 19 262 человеческих белка, полученных из 16 271 гена или кластеров генов, при этом было идентифицировано 8 новых генов, кодирующих белки, которые ранее считались псевдогенами. [32] Более ранний анализ показал, что человеческий PGAM4 (фосфоглицератмутаза), [33] ранее считавшийся псевдогеном, не только функционален, но и вызывает бесплодие в случае мутации. [34] [35]
Ряд псевдопсевдогенов также были обнаружены у прокариот, где некоторые замены стоп-кодонов в основных генах, по-видимому, сохраняются, даже при положительном отборе. [36] [37]
siRNAs . Некоторые эндогенные siRNAs , по-видимому, происходят от псевдогенов, и, таким образом, некоторые псевдогены играют роль в регуляции транскриптов, кодирующих белки, как было рассмотрено. [38] Одним из многих примеров является psiPPM1K. Обработка РНК, транскрибированных с psiPPM1K, дает siRNAs, которые могут подавлять наиболее распространенный тип рака печени, гепатоцеллюлярную карциному . [39] Это и многие другие исследования привели к значительному волнению относительно возможности нацеливания псевдогенов с помощью/в качестве терапевтических агентов [40]
piRNAs . Некоторые piRNAs происходят из псевдогенов, расположенных в кластерах piRNA. [41] Эти piRNAs регулируют гены через путь piRNA в яичках млекопитающих и имеют решающее значение для ограничения повреждения генома мобильными элементами . [42]
микроРНК . Существует множество сообщений о транскриптах псевдогенов, действующих как приманки микроРНК . Возможно, самым ранним определенным примером такого псевдогена, вовлеченного в рак, является псевдоген BRAF . Ген BRAF является протоонкогеном , который при мутации связан со многими видами рака. Обычно количество белка BRAF контролируется в клетках с помощью действия микроРНК. В обычных ситуациях количество РНК из BRAF и псевдогена BRAFP1 конкурируют за микроРНК, но баланс двух РНК таков, что клетки растут нормально. Однако, когда экспрессия РНК BRAFP1 увеличивается (либо экспериментально, либо в результате естественных мутаций), меньше микроРНК доступно для контроля экспрессии BRAF, и увеличенное количество белка BRAF вызывает рак. [43] Такого рода конкуренция за регуляторные элементы со стороны РНК, которые являются эндогенными для генома, привела к появлению термина ce RNA .
PTEN . Ген PTEN — известный ген-супрессор опухолей . Псевдоген PTEN, PTENP1 — это обработанный псевдоген, который по своей генетической последовательности очень похож на ген дикого типа. Однако PTENP1 имеет миссенс-мутацию, которая устраняет кодон для инициирующего метионина и, таким образом, предотвращает трансляцию нормального белка PTEN. [44] Несмотря на это, PTENP1, по-видимому, играет роль в онкогенезе . 3'- UTR мРНК PTENP1 функционирует как приманка мРНК PTEN, нацеливаясь на микроРНК из-за ее сходства с геном PTEN, а сверхэкспрессия 3'-UTR приводит к повышению уровня белка PTEN. [45] То есть сверхэкспрессия 3'-UTR PTENP1 приводит к повышению регуляции и подавлению раковых опухолей. Биология этой системы в основном является обратной по отношению к системе BRAF, описанной выше.
Потогены . Псевдогены могут, в эволюционных временных масштабах, участвовать в генной конверсии и других мутационных событиях, которые могут привести к появлению новых или вновь функциональных генов. Это привело к концепции, что псевдогены можно рассматривать как потогены : потенциальные гены для эволюционной диверсификации. [46]
Псевдогены обнаружены в бактериях . [47] Большинство из них обнаружено в бактериях, которые не являются свободноживущими; то есть они являются либо симбионтами , либо облигатными внутриклеточными паразитами . Таким образом, им не требуется много генов, которые необходимы свободноживущим бактериям, например, гены, связанные с метаболизмом и репарацией ДНК. Однако не существует порядка, в котором функциональные гены теряются в первую очередь. Например, самые старые псевдогены в Mycobacterium leprae находятся в РНК-полимеразах и биосинтезе вторичных метаболитов , тогда как самые старые в Shigella flexneri и Shigella typhi находятся в репликации ДНК , рекомбинации и репарации . [48]
Поскольку большинство бактерий, несущих псевдогены, являются либо симбионтами, либо облигатными внутриклеточными паразитами, размер генома в конечном итоге уменьшается. Крайним примером является геном Mycobacterium leprae , облигатного паразита и возбудителя проказы . Сообщается, что он имеет 1133 псевдогена, которые дают начало примерно 50% его транскриптома . [48] Эффект псевдогенов и сокращения генома можно еще больше увидеть при сравнении с Mycobacterium marinum , патогеном из того же семейства. Mycobacteirum marinum имеет больший геном по сравнению с Mycobacterium leprae , потому что он может выживать вне хозяина; следовательно, геном должен содержать гены, необходимые для этого. [49]
Хотя редукция генома фокусируется на том, какие гены не нужны, избавляясь от псевдогенов, селективное давление со стороны хозяина может повлиять на то, что сохраняется. В случае симбионта из типа Verrucomicrobiota существует семь дополнительных копий гена, кодирующего путь манделалида. [50] Хозяин, вид из Lissoclinum , использует манделалиды как часть своего защитного механизма. [50]
Связь между эпистазом и теорией домино потери генов наблюдалась у Buchnera aphidicola . Теория домино предполагает, что если один ген клеточного процесса становится инактивированным, то отбор в других вовлеченных генах ослабевает, что приводит к потере генов. [48] При сравнении Buchnera aphidicola и Escherichia coli было обнаружено , что положительный эпистаз способствует потере генов, тогда как отрицательный эпистаз препятствует этому.
This article is missing information about archaea.(December 2023) |