Часть серии статей о |
Генетика |
---|
Геном — это вся генетическая информация организма. [1] Он состоит из нуклеотидных последовательностей ДНК (или РНК в РНК-вирусах ). Ядерный геном включает гены, кодирующие белки, и некодирующие гены, другие функциональные области генома, такие как регуляторные последовательности (см. некодирующая ДНК ), и часто значительную часть мусорной ДНК без очевидной функции. [2] [3] Почти все эукариоты имеют митохондрии и небольшой митохондриальный геном . [2] Водоросли и растения также содержат хлоропласты с хлоропластным геномом.
Изучение генома называется геномикой . Геномы многих организмов были секвенированы , а различные регионы были аннотированы. Первым был секвенирован геном вируса φX174 в 1977 году; [4] первая последовательность генома прокариота ( Haemophilus influenzae ) была опубликована в 1995 году; [5] геном дрожжей ( Saccharomyces cerevisiae ) был первым эукариотическим геномом, который был секвенирован в 1996 году. [6] Проект «Геном человека» был начат в октябре 1990 года, а первые черновики последовательностей генома человека были опубликованы в феврале 2001 года. [7]
Термин геном был создан в 1920 году Гансом Винклером [8], профессором ботаники в Гамбургском университете , Германия. Сайт Oxford Dictionaries и Онлайн-словарь этимологии предполагают, что название представляет собой смесь слов ген и хромосома [9] [ 10] [11] [12] Однако см. омику для более подробного обсуждения. Несколько родственных слов -ome уже существовали, такие как биом и ризома , образуя словарь, в который геном систематически вписывается [13]
Термин «геном» обычно относится к молекулам ДНК (или иногда РНК), которые несут генетическую информацию в организме, но иногда неясно, какие молекулы следует включать; например, бактерии обычно имеют одну или две большие молекулы ДНК ( хромосомы ), которые содержат весь необходимый генетический материал, но они также содержат более мелкие внехромосомные плазмидные молекулы, которые несут важную генетическую информацию. В научной литературе термин «геном» обычно относится к большим хромосомным молекулам ДНК в бактериях. [14]
Геномы эукариот еще сложнее определить, поскольку почти все виды эукариот содержат ядерные хромосомы и дополнительные молекулы ДНК в митохондриях . Кроме того, водоросли и растения имеют хлоропластную ДНК. Большинство учебников проводят различие между ядерным геномом и геномами органелл (митохондрий и хлоропластов), поэтому, когда они говорят, скажем, о геноме человека, они имеют в виду только генетический материал в ядре. [2] [15] Это наиболее распространенное использование термина «геном» в научной литературе.
Большинство эукариот диплоидны , что означает, что в ядре есть две хромосомы каждой хромосомы, но «геном» относится только к одной копии каждой хромосомы. Некоторые эукариоты имеют отличительные половые хромосомы, такие как X и Y хромосомы млекопитающих, поэтому техническое определение генома должно включать обе копии половых хромосом. Например, стандартный референтный геном человека состоит из одной копии каждой из 22 аутосом плюс одна X хромосома и одна Y хромосома. [16]
Последовательность генома — это полный список нуклеотидов ( A, C, G и T для ДНК-геномов), которые составляют все хромосомы особи или вида. Внутри вида подавляющее большинство нуклеотидов идентичны между особями, но для понимания генетического разнообразия необходимо секвенирование нескольких особей.
В 1976 году Уолтер Фирс из Гентского университета (Бельгия) первым установил полную нуклеотидную последовательность вирусного РНК-генома ( бактериофаг MS2 ). В следующем году Фред Сэнгер завершил первую последовательность ДНК-генома: фаг X174 , из 5386 пар оснований. [17] Первым бактериальным геномом, который был секвенирован, был геном Haemophilus influenzae , завершенный группой из Института геномных исследований в 1995 году. Несколько месяцев спустя был завершен первый эукариотический геном, с последовательностями 16 хромосом почкующихся дрожжей Saccharomyces cerevisiae, опубликованными в результате европейских усилий, начатых в середине 1980-х годов. Первая последовательность генома археи , Methanococcus jannaschii , была завершена в 1996 году, снова Институтом геномных исследований. [ необходима ссылка ]
Развитие новых технологий сделало секвенирование генома значительно дешевле и проще, а число полных последовательностей генома быстро растет. Национальные институты здравоохранения США поддерживают одну из нескольких всеобъемлющих баз данных геномной информации. [18] Среди тысяч завершенных проектов по секвенированию генома есть проекты для риса , мыши , растения Arabidopsis thaliana , рыбы-собаки и бактерий E. coli . В декабре 2013 года ученые впервые секвенировали весь геном неандертальца , вымершего вида людей . Геном был извлечен из кости пальца ноги 130 000-летнего неандертальца, найденного в сибирской пещере . [19] [20]
Вирусные геномы могут состоять либо из РНК, либо из ДНК. Геномы РНК-вирусов могут быть либо одноцепочечными РНК , либо двухцепочечными РНК и могут содержать одну или несколько отдельных молекул РНК (сегментов: одноцепочечный или многоцепочечный геном). ДНК-вирусы могут иметь либо одноцепочечные, либо двухцепочечные геномы. Большинство геномов ДНК-вирусов состоят из одной линейной молекулы ДНК, но некоторые состоят из кольцевой молекулы ДНК. [21]
Прокариоты и эукариоты имеют ДНК-геномы. Археи и большинство бактерий имеют одну кольцевую хромосому , [22] однако, некоторые виды бактерий имеют линейные или множественные хромосомы. [23] [24] Если ДНК реплицируется быстрее, чем делятся бактериальные клетки, в одной клетке может присутствовать несколько копий хромосомы, а если клетки делятся быстрее, чем ДНК может реплицироваться, множественная репликация хромосомы инициируется до того, как произойдет деление, что позволяет дочерним клеткам наследовать полные геномы и уже частично реплицированные хромосомы. Большинство прокариот имеют очень мало повторяющейся ДНК в своих геномах. [25] Однако некоторые симбиотические бактерии (например, Serratia symbiotica ) имеют редуцированные геномы и высокую долю псевдогенов: только ~40% их ДНК кодирует белки. [26] [27]
Некоторые бактерии имеют вспомогательный генетический материал, также являющийся частью их генома, который переносится в плазмидах . В связи с этим слово геном не следует использовать как синоним хромосомы .
Геномы эукариот состоят из одной или нескольких линейных ДНК-хромосом. Количество хромосом сильно варьируется от муравьев-прыгунов Джека и бесполых немотод , [28] у которых только одна пара, до видов папоротников , у которых их 720 пар. [29] Удивительно количество ДНК, которое содержат геномы эукариот по сравнению с другими геномами. Это количество даже больше, чем необходимо для кодирующих и некодирующих белок ДНК генов, из-за того, что геномы эукариот показывают до 64 000-кратной вариации в своих размерах. [30] Однако эта особая характеристика вызвана наличием повторяющейся ДНК и мобильных элементов (TE).
Типичная человеческая клетка имеет две копии каждой из 22 аутосом , по одной унаследованной от каждого родителя, плюс две половые хромосомы , что делает ее диплоидной. Гаметы , такие как яйцеклетки, сперма, споры и пыльца, гаплоидны, то есть они несут только одну копию каждой хромосомы. В дополнение к хромосомам в ядре, органеллы, такие как хлоропласты и митохондрии, имеют свою собственную ДНК. Иногда говорят, что митохондрии имеют свой собственный геном, часто называемый « митохондриальным геномом ». ДНК, обнаруженную внутри хлоропласта, можно назвать « пластомом ». Как и бактерии, от которых они произошли, митохондрии и хлоропласты имеют кольцевую хромосому.
В отличие от прокариот, где экзон-интронная организация генов, кодирующих белок, существует, но является скорее исключением, эукариоты обычно имеют эти особенности в своих генах, и их геномы содержат различные количества повторяющейся ДНК. У млекопитающих и растений большая часть генома состоит из повторяющейся ДНК. [31]
Высокопроизводительная технология делает секвенирование для сборки новых геномов доступным для всех. Полиморфизмы последовательностей обычно обнаруживаются путем сравнения повторно секвенированных изолятов с эталоном, тогда как анализ глубины покрытия и топологии картирования может предоставить подробную информацию о структурных вариациях, таких как хромосомные транслокации и сегментарные дупликации.
Последовательности ДНК, несущие инструкции по созданию белков, называются кодирующими последовательностями. Доля генома, занимаемая кодирующими последовательностями, сильно варьируется. Больший геном не обязательно содержит больше генов, а доля неповторяющейся ДНК уменьшается с увеличением размера генома у сложных эукариот. [31]
Некодирующие последовательности включают интроны , последовательности для некодирующих РНК, регуляторные области и повторяющуюся ДНК. Некодирующие последовательности составляют 98% генома человека. В геноме есть две категории повторяющейся ДНК: тандемные повторы и перемежающиеся повторы. [32]
Короткие некодирующие последовательности, которые повторяются голова к хвосту, называются тандемными повторами . Микросателлиты, состоящие из 2–5 повторов пар оснований, в то время как минисателлитные повторы состоят из 30–35 п.н. Тандемные повторы составляют около 4% генома человека и 9% генома плодовой мушки. [33] Тандемные повторы могут быть функциональными. Например, теломеры состоят из тандемного повтора TTAGGG у млекопитающих, и они играют важную роль в защите концов хромосомы.
В других случаях расширение числа тандемных повторов в экзонах или интронах может вызвать заболевание . [34] Например, человеческий ген хантингтин (Htt) обычно содержит 6–29 тандемных повторов нуклеотидов CAG (кодирующих полиглутаминовый тракт). Расширение до более чем 36 повторов приводит к болезни Хантингтона , нейродегенеративному заболеванию. Известно, что двадцать человеческих расстройств являются результатом подобных расширений тандемных повторов в различных генах. Механизм, посредством которого белки с расширенными полигулатаминовыми трактами вызывают гибель нейронов, до конца не изучен. Одна из возможностей заключается в том, что белки не могут правильно сворачиваться и избегать деградации, вместо этого накапливаясь в агрегатах, которые также секвестрируют важные факторы транскрипции, тем самым изменяя экспрессию генов. [34]
Тандемные повторы обычно возникают из-за проскальзывания во время репликации, неравного кроссинговера и генной конверсии. [35]
Мобильные элементы (TE) — это последовательности ДНК с определенной структурой, которые способны изменять свое местоположение в геноме. [33] [25] [36] TE классифицируются либо как механизм, который реплицируется путем копирования и вставки, либо как механизм, который может быть вырезан из генома и вставлен в новое место. В геноме человека есть три важных класса TE, которые составляют более 45% человеческой ДНК; эти классы — длинные вкрапленные ядерные элементы (LINEs), вкрапленные ядерные элементы (SINEs) и эндогенные ретровирусы. Эти элементы имеют большой потенциал для изменения генетического контроля в организме-хозяине. [30]
Перемещение ТЕ является движущей силой эволюции генома эукариот, поскольку их вставка может нарушить функции генов, гомологичная рекомбинация между ТЕ может привести к дупликациям, а ТЕ может перетасовывать экзоны и регуляторные последовательности в новые места. [37]
Ретротранспозоны [38] в основном встречаются у эукариот, но не встречаются у прокариот. Ретротранспозоны составляют большую часть геномов многих эукариот. Ретротранспозон — это переносимый элемент, который перемещается через промежуточное звено РНК . Ретротранспозоны [39] состоят из ДНК , но транскрибируются в РНК для транспозиции, затем транскрипт РНК копируется обратно в ДНК с помощью специфического фермента, называемого обратной транскриптазой. Ретротранспозон, который несет обратную транскриптазу в своей последовательности, может запустить собственную транспозицию, но ретротранспозоны, у которых отсутствует обратная транскриптаза, должны использовать обратную транскриптазу, синтезированную другим ретротранспозоном. Ретротранспозоны могут транскрибироваться в РНК, которая затем дублируется в другом месте генома. [40] Ретротранспозоны можно разделить на длинные концевые повторы (LTR) и недлинные концевые повторы (Non-LTR). [37]
Длинные концевые повторы (LTR) происходят от древних ретровирусных инфекций, поэтому они кодируют белки, связанные с ретровирусными белками, включая гены gag (структурные белки вируса), pol (обратная транскриптаза и интеграза), pro (протеаза) и в некоторых случаях env (оболочка). [36] Эти гены окружены длинными повторами как на 5', так и на 3' концах. Сообщалось, что LTR составляют наибольшую часть в большинстве геномов растений и могут объяснять огромную вариацию размера генома. [41]
Недлинные концевые повторы (Non-LTR) классифицируются как длинные вставленные ядерные элементы (LINE), короткие вставленные ядерные элементы (SINE) и элементы, подобные Пенелопе (PLE). У Dictyostelium discoideum есть еще один DIRS-подобный элемент, относящийся к Non-LTR. Non-LTR широко распространены в эукариотических геномах. [42]
Длинные вкрапленные элементы (LINE) кодируют гены обратной транскриптазы и эндонуклеазы, что делает их автономными транспонируемыми элементами. Геном человека содержит около 500 000 LINE, занимая около 17% генома. [43]
Короткие вкрапленные элементы (SINE) обычно состоят из менее чем 500 пар оснований и не являются автономными, поэтому они полагаются на белки, кодируемые LINE для транспозиции. [44] Элемент Alu является наиболее распространенным SINE, обнаруженным у приматов. Он состоит из около 350 пар оснований и занимает около 11% человеческого генома с примерно 1 500 000 копий. [37]
ДНК-транспозоны кодируют фермент транспозазу между инвертированными концевыми повторами. При экспрессии транспозаза распознает концевые инвертированные повторы, которые фланкируют транспозон, и катализирует его вырезание и повторную вставку в новом месте. [33] Этот механизм вырезания и вставки обычно повторно вставляет транспозоны вблизи их первоначального местоположения (в пределах 100 кб). [37] ДНК-транспозоны обнаружены в бактериях и составляют 3% генома человека и 12% генома круглого червя C. elegans . [37]
Размер генома — это общее количество пар оснований ДНК в одной копии гаплоидного генома. Размер генома сильно варьируется у разных видов. У беспозвоночных небольшие геномы, это также коррелирует с небольшим количеством мобильных элементов. У рыб и земноводных геномы промежуточного размера, а у птиц относительно небольшие геномы, но предполагается, что птицы потеряли значительную часть своих геномов во время фазы перехода к полету. До этой потери метилирование ДНК обеспечивает адекватное расширение генома. [30]
У людей ядерный геном состоит приблизительно из 3,1 миллиарда нуклеотидов ДНК, разделенных на 24 линейные молекулы, самая короткая из которых имеет длину 45 000 000 нуклеотидов, а самая длинная — 248 000 000 нуклеотидов, каждая из которых находится в отдельной хромосоме. [45] Не существует четкой и последовательной корреляции между морфологической сложностью и размером генома ни у прокариот , ни у низших эукариот . [31] [46] Размер генома в значительной степени зависит от расширения и сжатия повторяющихся элементов ДНК.
Поскольку геномы очень сложны, одна из исследовательских стратегий заключается в том, чтобы сократить количество генов в геноме до абсолютного минимума и при этом сохранить выживаемость рассматриваемого организма. Проводится экспериментальная работа по минимальным геномам для одноклеточных организмов, а также по минимальным геномам для многоклеточных организмов (см. биологию развития ). Работа ведется как in vivo , так и in silico . [47] [48]
Существует множество огромных различий в размерах геномов, особенно упомянутых ранее в многоклеточных эукариотических геномах. Во многом это связано с различным обилием транспозируемых элементов, которые эволюционируют, создавая новые копии себя в хромосомах. [30] Геномы эукариот часто содержат многие тысячи копий этих элементов, большинство из которых приобрели мутации, делающие их дефектными.
Все клетки организма происходят из одной клетки, поэтому ожидается, что они будут иметь идентичные геномы; однако в некоторых случаях возникают различия. Как процесс копирования ДНК во время деления клеток, так и воздействие мутагенов окружающей среды могут приводить к мутациям в соматических клетках. В некоторых случаях такие мутации приводят к раку, поскольку они заставляют клетки делиться быстрее и проникать в окружающие ткани. [49] В некоторых лимфоцитах иммунной системы человека рекомбинация V(D)J генерирует различные геномные последовательности, так что каждая клетка вырабатывает уникальное антитело или рецепторы Т-клеток.
Во время мейоза диплоидные клетки делятся дважды, образуя гаплоидные зародышевые клетки. В ходе этого процесса рекомбинация приводит к перетасовке генетического материала из гомологичных хромосом, поэтому каждая гамета имеет уникальный геном.
Перепрограммирование по всему геному в первичных зародышевых клетках мыши включает эпигенетическое стирание импринта, приводящее к тотипотентности . Перепрограммирование облегчается активным деметилированием ДНК , процессом, который влечет за собой путь репарации эксцизионной репарации оснований ДНК . [50] Этот путь используется для стирания метилирования CpG (5mC) в первичных зародышевых клетках. Стирание 5mC происходит посредством его преобразования в 5-гидроксиметилцитозин (5hmC), вызванного высокими уровнями ферментов диоксигеназы ten-eleven TET1 и TET2 . [51]
Геномы — это больше, чем сумма генов организма , и у них есть черты, которые можно измерить и изучить без ссылки на детали каких-либо конкретных генов и их продуктов. Исследователи сравнивают такие черты, как кариотип (число хромосом), размер генома , порядок генов, смещение использования кодонов и содержание GC , чтобы определить, какие механизмы могли произвести большое разнообразие геномов, которые существуют сегодня (для недавних обзоров см. Brown 2002; Saccone and Pesole 2003; Benfey and Protopapas 2004; Gibson and Muse 2004; Reese 2004; Gregory 2005).
Дупликации играют важную роль в формировании генома. Дупликация может варьироваться от расширения коротких тандемных повторов до дупликации кластера генов и вплоть до дупликации целых хромосом или даже целых геномов . Такие дупликации, вероятно, имеют основополагающее значение для создания генетической новизны.
Горизонтальный перенос генов привлекается для объяснения того, как часто существует чрезвычайное сходство между небольшими частями геномов двух организмов, которые в остальном очень отдаленно связаны. Горизонтальный перенос генов, по-видимому, распространен среди многих микробов . Кроме того, эукариотические клетки , по-видимому, испытали перенос некоторого генетического материала из своих хлоропластных и митохондриальных геномов в свои ядерные хромосомы. Недавние эмпирические данные указывают на важную роль вирусов и субвирусных РНК-сетей, представляющих собой основную движущую роль для генерации генетической новизны и естественного редактирования генома.
Произведения научной фантастики иллюстрируют обеспокоенность по поводу доступности геномных последовательностей.
Роман Майкла Крайтона «Парк Юрского периода» 1990 года и последующий фильм рассказывают историю миллиардера, который создает тематический парк клонированных динозавров на отдаленном острове, что приводит к катастрофическим последствиям. Генетик извлекает ДНК динозавра из крови древних комаров и заполняет пробелы ДНК современных видов, чтобы создать несколько видов динозавров. Теоретика хаоса просят дать свое экспертное мнение о безопасности проектирования экосистемы с динозаврами, и он неоднократно предупреждает, что результаты проекта будут непредсказуемыми и в конечном итоге неконтролируемыми. Эти предупреждения об опасностях использования геномной информации являются основной темой книги.
Действие фильма 1997 года «Гаттака» происходит в футуристическом обществе, где геномы детей конструируются так, чтобы содержать наиболее идеальное сочетание черт их родителей, а такие показатели, как риск сердечных заболеваний и прогнозируемая продолжительность жизни, документируются для каждого человека на основе его генома. Люди, зачатые вне программы евгеники, известные как «инвалиды», страдают от дискриминации и низводятся до черных профессий. Главный герой фильма — инвалид, который пытается бросить вызов предполагаемым генетическим шансам и осуществить свою мечту работать космическим навигатором. Фильм предостерегает от будущего, в котором геномная информация подпитывает предрассудки и крайние классовые различия между теми, кто может и не может позволить себе генетически модифицированных детей. [52]
{{cite journal}}
: CS1 maint: url-status ( ссылка )