Сайты CpG или CG-сайты — это области ДНК , где за нуклеотидом цитозина следует нуклеотид гуанина в линейной последовательности оснований вдоль направления 5' → 3' . Сайты CpG с высокой частотой встречаются в геномных областях, называемых CpG-островками .
Цитозины в динуклеотидах CpG могут быть метилированы с образованием 5-метилцитозинов . Ферменты , которые добавляют метильную группу , называются ДНК-метилтрансферазами . У млекопитающих метилировано от 70% до 80% цитозинов CpG. [1] Метилирование цитозина в гене может изменить его экспрессию, механизм, который является частью более обширной области науки, изучающей регуляцию генов, которая называется эпигенетика . Метилированные цитозины часто мутируют в тимины .
У людей около 70% промоторов , расположенных вблизи места начала транскрипции гена (проксимальные промоторы), содержат островок CpG. [2] [3]
CpG — это сокращение от 5'—C—фосфат—G—3' , то есть цитозин и гуанин, разделенные только одной фосфатной группой; фосфат связывает любые два нуклеозида вместе в ДНК. Обозначение CpG используется для различения этой одноцепочечной линейной последовательности от спаривания оснований CG цитозина и гуанина для двухцепочечных последовательностей. Поэтому обозначение CpG следует интерпретировать как цитозин, являющийся 5-примированным основанием гуанина. CpG не следует путать с GpC , последнее означает, что за гуанином следует цитозин в направлении 5' → 3' одноцепочечной последовательности.
CpG-динуклеотиды уже давно наблюдаются с гораздо более низкой частотой в последовательности геномов позвоночных, чем можно было бы ожидать из-за случайности. Например, в геноме человека, который имеет 42% содержания GC , [4] пара нуклеотидов, состоящая из цитозина, за которым следует гуанин, как можно было бы ожидать, должна была бы появиться в то время. Частота CpG-динуклеотидов в геномах человека составляет менее одной пятой от ожидаемой частоты. [5]
Эта недопредставленность является следствием высокой скорости мутации метилированных сайтов CpG: спонтанно происходящее дезаминирование метилированного цитозина приводит к образованию тимина , а полученные несовпадающие основания G:T часто неправильно разрешаются в A:T; тогда как дезаминирование неметилированного цитозина приводит к образованию урацила , который как чужеродное основание быстро заменяется цитозином с помощью механизма репарации эксцизии основания . Скорость перехода C в T в метилированных сайтах CpG примерно в 10 раз выше, чем в неметилированных сайтах. [6] [7] [8] [9]
CpG-сайты | Сайты GpC |
---|---|
Распределение участков CpG (слева: красным) и участков GpC (справа: зеленым) в гене APRT человека . CpG более распространены в восходящем участке гена, где они образуют остров CpG , тогда как GpC распределены более равномерно. 5 экзонов гена APRT обозначены (синим), а стартовый (ATG) и стоп-кодоны (TGA) подчеркнуты (жирным синим). |
Динуклеотиды CpG часто встречаются в CpG-островках (см. определение CpG-островков ниже). В геноме человека имеется 28 890 CpG-островков (50 267, если включить CpG-островки в повторяющиеся последовательности). [10] Это согласуется с 28 519 CpG-островками, обнаруженными Вентером и др. [11], поскольку последовательность генома Вентера и др. не включала внутренние части очень похожих повторяющихся элементов и чрезвычайно плотные области повторов вблизи центромер. [12] Поскольку CpG-островки содержат несколько последовательностей динуклеотидов CpG, в геноме человека, по-видимому, содержится более 20 миллионов CpG-динуклеотидов.
Острова CpG (или островки CG) представляют собой регионы с высокой частотой сайтов CpG. Хотя объективные определения для островов CpG ограничены, обычное формальное определение — это регион с не менее чем 200 п.н. , процентом GC более 50% и отношением наблюдаемого к ожидаемому CpG более 60%. «Отношение наблюдаемого к ожидаемому CpG» может быть получено, когда наблюдаемое рассчитывается как: и ожидаемое как [13] или . [14]
Многие гены в геномах млекопитающих имеют CpG-островки, связанные с началом гена [15] ( промоторные регионы ). В связи с этим наличие CpG-островка используется для помощи в прогнозировании и аннотации генов.
В геномах млекопитающих CpG-островки обычно имеют длину 300–3000 пар оснований и были обнаружены в или около 40% промоторов генов млекопитающих. [16] Более 60% человеческих генов и почти все гены домашнего хозяйства имеют свои промоторы, встроенные в CpG-островки. [17] Учитывая частоту двухнуклеотидных последовательностей GC, количество CpG-динуклеотидов намного ниже, чем можно было бы ожидать. [14]
Исследование 2002 года пересмотрело правила предсказания CpG-островков, чтобы исключить другие геномные последовательности, богатые GC, такие как повторы Alu . На основе обширного поиска полных последовательностей человеческих хромосом 21 и 22, было обнаружено, что области ДНК более 500 п.н. с большей вероятностью являются «истинными» CpG-островками, связанными с 5'-областями генов, если они имели содержание GC более 55% и наблюдаемое к ожидаемому отношение CpG 65%. [18]
Острова CpG характеризуются содержанием динуклеотидов CpG не менее 60% от того, что статистически ожидалось бы (~4–6%), тогда как остальная часть генома имеет гораздо более низкую частоту CpG (~1%), явление, называемое подавлением CG . В отличие от участков CpG в кодирующей области гена, в большинстве случаев участки CpG в островах CpG промоторов неметилированы, если гены экспрессируются. Это наблюдение привело к предположению, что метилирование участков CpG в промоторе гена может ингибировать экспрессию генов. Метилирование, наряду с модификацией гистонов , играет центральную роль в импринтинге . [19] Большинство различий в метилировании между тканями или между нормальными и раковыми образцами происходят на небольшом расстоянии от островов CpG (на «берегах островов CpG»), а не в самих островах. [20]
Островки CpG обычно встречаются в месте начала транскрипции генов, в частности генов домашнего хозяйства , у позвоночных. [14] Основание AC (цитозин), за которым сразу следует основание G (гуанин) (a CpG), встречается редко в ДНК позвоночных, поскольку цитозины в таком расположении, как правило, метилированы. Это метилирование помогает отличить вновь синтезированную цепь ДНК от родительской цепи, что помогает на последних этапах проверки ДНК после дупликации. Однако со временем метилированные цитозины, как правило, превращаются в тимины из-за спонтанного дезаминирования . У людей существует специальный фермент ( тимин-ДНК-гликозилаза , или TDG), который специально заменяет T из несовпадений T/G. Однако из-за редкости CpG предполагается, что он недостаточно эффективен для предотвращения возможной быстрой мутации динуклеотидов. Существование CpG-островков обычно объясняется существованием селективных сил для относительно высокого содержания CpG или низкого уровня метилирования в этой области генома, возможно, связанных с регуляцией экспрессии генов. Исследование 2011 года показало, что большинство CpG-островков являются результатом неселективных сил. [21]
У людей около 70% промоторов , расположенных вблизи места начала транскрипции гена (проксимальные промоторы), содержат островок CpG. [2] [3]
Дистальные элементы промотора также часто содержат CpG-островки. Примером является ген репарации ДНК ERCC1 , где элемент, содержащий CpG-островок, расположен примерно на 5400 нуклеотидов выше сайта начала транскрипции гена ERCC1 . [22] CpG-островки также часто встречаются в промоторах для функциональных некодирующих РНК, таких как микроРНК . [23]
У людей метилирование ДНК происходит в 5-й позиции пиримидинового кольца остатков цитозина в CpG-сайтах с образованием 5-метилцитозинов . Наличие множественных метилированных CpG-сайтов в CpG-островках промоторов вызывает стабильное подавление генов. [24] Подавление гена может быть инициировано другими механизмами, но за этим часто следует метилирование CpG-сайтов в CpG-островке промотора, что вызывает стабильное подавление гена. [24]
При раке потеря экспрессии генов происходит примерно в 10 раз чаще из-за гиперметилирования промоторных CpG-островков, чем из-за мутаций. Например, при колоректальном раке обычно наблюдается около 3–6 мутаций драйвера и от 33 до 66 мутаций попутчика или пассажира. [25] Напротив, в одном исследовании опухолей толстой кишки по сравнению с прилегающей нормальной слизистой оболочкой толстой кишки 1734 CpG-островка были сильно метилированы в опухолях, тогда как эти CpG-островки не были метилированы в прилегающей слизистой оболочке. [26] Половина CpG-островков находилась в промоторах аннотированных генов, кодирующих белок, [26] что позволяет предположить, что около 867 генов в опухоли толстой кишки потеряли экспрессию из-за метилирования CpG-островков. Отдельное исследование обнаружило в среднем 1549 дифференциально метилированных областей (гиперметилированных или гипометилированных) в геномах шести видов рака толстой кишки (по сравнению с прилегающей слизистой оболочкой), из которых 629 находились в известных промоторных областях генов. [27] Третье исследование обнаружило более 2000 генов, дифференциально метилированных между раком толстой кишки и прилегающей слизистой оболочкой. Используя анализ обогащения генных наборов , 569 из 938 наборов генов были гиперметилированы и 369 были гипометилированы при раке. [28] Гипометилирование CpG-островков в промоторах приводит к сверхэкспрессии генов или затронутых наборов генов.
В одном исследовании 2012 года [29] перечислены 147 конкретных генов с гиперметилированными промоторами, связанными с раком толстой кишки, а также частота, с которой эти гиперметилирования были обнаружены при раке толстой кишки. По крайней мере 10 из этих генов имели гиперметилированные промоторы почти в 100% случаев рака толстой кишки. Они также указали 11 микроРНК , промоторы которых были гиперметилированы при раке толстой кишки с частотой от 50% до 100% случаев рака. МикроРНК (миРНК) — это небольшие эндогенные РНК, которые соединяются с последовательностями в матричных РНК для управления посттранскрипционной репрессией. В среднем каждая микроРНК подавляет несколько сотен целевых генов. [30] Таким образом, микроРНК с гиперметилированными промоторами могут допускать сверхэкспрессию сотен или тысяч генов при раке.
Приведенная выше информация показывает, что при раковых заболеваниях гипер-/гипометилирование CpG-промотора генов и микроРНК приводит к потере экспрессии (или иногда к повышению экспрессии) гораздо большего количества генов, чем мутация.
Гены репарации ДНК часто подавляются при раке из-за гиперметилирования CpG-островков в их промоторах. В плоскоклеточных карциномах головы и шеи по крайней мере 15 генов репарации ДНК имеют часто гиперметилированные промоторы; это гены XRCC1 , MLH3 , PMS1 , RAD51B, XRCC3, RAD54B , BRCA1 , SHFM1 , GEN1 , FANCE , FAAP20, SPRTN , SETMAR , HUS1 и PER1 . [31] Около семнадцати типов рака часто имеют дефицит одного или нескольких генов репарации ДНК из-за гиперметилирования их промоторов. [32] Например, гиперметилирование промотора гена репарации ДНК MGMT встречается в 93% случаев рака мочевого пузыря, 88% случаев рака желудка, 74% случаев рака щитовидной железы, 40%-90% случаев колоректального рака и 50% случаев рака мозга. Гиперметилирование промотора LIG4 встречается в 82% случаев колоректального рака. Гиперметилирование промотора NEIL1 встречается в 62% случаев рака головы и шеи и в 42% случаев немелкоклеточного рака легких . Гиперметилирование промотора ATM встречается в 47% случаев немелкоклеточного рака легких . Гиперметилирование промотора MLH1 встречается в 48% случаев плоскоклеточного рака легких . Гиперметилирование промотора FANCB встречается в 46% случаев рака головы и шеи .
С другой стороны, промоторы двух генов, PARP1 и FEN1 , были гипометилированы, и эти гены были сверхэкспрессированы в многочисленных видах рака. PARP1 и FEN1 являются важными генами в подверженном ошибкам и мутагенном пути репарации ДНК, опосредованном микрогомологией соединении концов . Если этот путь сверхэкспрессирован, избыточные мутации, которые он вызывает, могут привести к раку. PARP1 сверхэкспрессируется при лейкозах, активируемых тирозинкиназой, [33] при нейробластоме, [34] при опухолях яичек и других опухолях зародышевых клеток, [35] и при саркоме Юинга, [36] FEN1 сверхэкспрессируется в большинстве видов рака молочной железы, [37] простаты, [38] желудка, [39] [40] нейробластом, [41] поджелудочной железы, [42] и легких. [43]
Повреждение ДНК, по-видимому, является основной причиной рака. [44] [45] Если точная репарация ДНК недостаточна, повреждения ДНК имеют тенденцию накапливаться. Такое избыточное повреждение ДНК может увеличить мутационные ошибки во время репликации ДНК из-за подверженного ошибкам синтеза транслезиона . Избыточное повреждение ДНК также может увеличить эпигенетические изменения из-за ошибок во время репарации ДНК. [46] [47] Такие мутации и эпигенетические изменения могут привести к раку (см. злокачественные новообразования ). Таким образом, гипер/гипометилирование CpG-островков в промоторах генов репарации ДНК, вероятно, играет центральную роль в прогрессировании рака.
Поскольку возраст оказывает сильное влияние на уровни метилирования ДНК в десятках тысяч участков CpG, можно определить высокоточные биологические часы (называемые эпигенетическими часами или возрастом метилирования ДНК ) у людей и шимпанзе. [48]
Неметилированные динуклеотидные сайты CpG могут быть обнаружены Toll-подобным рецептором 9 ( TLR 9 ) [49] на плазмацитоидных дендритных клетках , моноцитах , естественных киллерных (NK) клетках и В-клетках у людей. Это используется для обнаружения внутриклеточной вирусной инфекции.
У млекопитающих ДНК-метилтрансферазы (которые добавляют метильные группы к основаниям ДНК) демонстрируют предпочтение последовательности цитозинов в сайтах CpG. [50] В мозге мыши 4,2% всех цитозинов метилированы, в основном в контексте сайтов CpG, образуя 5mCpG. [51] Большинство гиперметилированных сайтов 5mCpG усиливают репрессию связанных генов. [51]
Как было рассмотрено Дьюком и др., метилирование ДНК нейронов (подавление экспрессии определенных генов) изменяется нейронной активностью. Метилирование ДНК нейронов необходимо для синаптической пластичности ; изменяется под воздействием опыта; а активное метилирование и деметилирование ДНК необходимо для формирования и поддержания памяти. [52]
В 2016 году Гальдер и др. [53] с использованием мышей, а в 2017 году Дьюк и др. [52] с использованием крыс подвергли грызунов контекстному условному рефлексу страха , что привело к формированию особенно сильной долговременной памяти . Через 24 часа после условного рефлекса в области гиппокампа мозга крыс экспрессия 1048 генов была снижена (обычно связана с 5mCpG в промоторах генов ), а экспрессия 564 генов была повышена (часто связана с гипометилированием участков CpG в промоторах генов). Через 24 часа после обучения 9,2% генов в геноме нейронов гиппокампа крысы были дифференциально метилированы. Однако, хотя гиппокамп необходим для изучения новой информации, он сам по себе информацию не хранит. В экспериментах Гальдера на мышах 1206 дифференциально метилированных генов были обнаружены в гиппокампе через час после контекстного условного рефлекса страха, но эти измененные метилирования были обращены вспять и не наблюдались через четыре недели. В отличие от отсутствия долгосрочных изменений метилирования CpG в гиппокампе, существенное дифференциальное метилирование CpG можно было обнаружить в корковых нейронах во время поддержания памяти. В передней поясной коре мышей через четыре недели после контекстного условного рефлекса страха было обнаружено 1223 дифференциально метилированных гена.
В соматических клетках взрослых метилирование ДНК обычно происходит в контексте динуклеотидов CpG ( сайты CpG ), образуя 5-метилцитозин -pG или 5mCpG. Активные формы кислорода (ROS) могут атаковать гуанин в динуклеотидном сайте, образуя 8-гидрокси-2'-дезоксигуанозин (8-OHdG), и в результате получается динуклеотидный сайт 5mCp-8-OHdG. Фермент репарации эксцизии оснований OGG1 нацелен на 8-OHdG и связывается с повреждением без немедленного удаления. OGG1, присутствующий в сайте 5mCp-8-OHdG, рекрутирует TET1 , а TET1 окисляет 5mC, соседний с 8-OHdG. Это инициирует деметилирование 5mC. [54]
Как было рассмотрено в 2018 году, [55] в нейронах мозга 5mC окисляется семейством транслокации ten-eleven (TET) диоксигеназ ( TET1 , TET2 , TET3 ) с образованием 5-гидроксиметилцитозина (5hmC). На последовательных этапах ферменты TET дополнительно гидроксилируют 5hmC с образованием 5-формилцитозина (5fC) и 5-карбоксилцитозина (5caC). Тимин-ДНК-гликозилаза (TDG) распознает промежуточные основания 5fC и 5caC и вырезает гликозидную связь, в результате чего образуется апиримидиновый сайт ( сайт AP ). В альтернативном пути окислительного дезаминирования 5hmC может быть окислительно дезаминирован дезаминазами цитидиндезаминазы/комплекса редактирования мРНК аполипопротеина B (AID/APOBEC), индуцируемыми активностью , с образованием 5-гидроксиметилурацила (5hmU) или 5mC может быть преобразован в тимин (Thy). 5hmU может быть расщеплен TDG, одноцепочечной селективной монофункциональной урацил-ДНК-гликозилазой 1 ( SMUG1 ), Nei-подобной ДНК-гликозилазой 1 ( NEIL1 ) или метил-CpG-связывающим белком 4 ( MBD4 ). Затем сайты AP и несоответствия T:G исправляются ферментами репарации эксцизии оснований (BER) с получением цитозина (Cyt).
Два обзора [56] [57] суммируют большой объем доказательств критической и существенной роли ROS в формировании памяти . Деметилирование ДНК тысяч участков CpG во время формирования памяти зависит от инициирования ROS. В 2016 году Чжоу и др. [54] показали, что ROS играют центральную роль в деметилировании ДНК .
TET1 является ключевым ферментом, участвующим в деметилировании 5mCpG. Однако TET1 способен воздействовать на 5mCpG только в том случае, если ROS сначала воздействовал на гуанин с образованием 8-гидрокси-2'-дезоксигуанозина (8-OHdG), что приводит к образованию динуклеотида 5mCp-8-OHdG (см. первый рисунок в этом разделе). [54] После образования 5mCp-8-OHdG фермент репарации эксцизии оснований OGG1 связывается с повреждением 8-OHdG без немедленного вырезания. Присоединение OGG1 к участку 5mCp-8-OHdG рекрутирует TET1 , позволяя TET1 окислять 5mC, смежный с 8-OHdG, как показано на первом рисунке в этом разделе. Это инициирует путь деметилирования, показанный на втором рисунке в этом разделе.
Измененная экспрессия белка в нейронах, контролируемая ROS-зависимым деметилированием участков CpG в промоторах генов в нейронной ДНК, играет центральную роль в формировании памяти. [58]
Истощение CpG наблюдалось в процессе метилирования ДНК мобильных элементов (TE), где TE не только ответственны за расширение генома, но и за потерю CpG в ДНК хозяина. TE могут быть известны как «центры метилирования», посредством которых процесс метилирования, TE распространяется на фланкирующую ДНК, когда она находится в ДНК хозяина. Это распространение может впоследствии привести к потере CpG в течение эволюционного времени. Более старые эволюционные времена показывают более высокую потерю CpG во фланкирующей ДНК по сравнению с более молодыми эволюционными временами. Таким образом, метилирование ДНК может в конечном итоге привести к заметной потере сайтов CpG в соседней ДНК. [59]
Обычно существует обратная корреляция между размером генома и числом CpG-островков, поскольку более крупные геномы обычно имеют большее число транспонируемых элементов. Селективное давление против TE существенно снижается, если экспрессия подавляется посредством метилирования, в дальнейшем TE могут действовать как «центры метилирования», облегчая метилирование фланкирующей ДНК. Поскольку метилирование снижает селективное давление на нуклеотидную последовательность, долгосрочное метилирование сайтов CpG увеличивает накопление спонтанных переходов цитозина в тимин, тем самым приводя к потере сайтов Cp. [59]
Элементы Alu известны как наиболее распространенный тип мобильных элементов. Некоторые исследования использовали элементы Alu как способ изучения факторов, ответственных за расширение генома. Элементы Alu богаты CpG в более длинном количестве последовательности, в отличие от LINE и ERV. Alus может работать как центр метилирования, а вставка в ДНК хозяина может вызывать метилирование ДНК и провоцировать распространение в область фланкирующей ДНК. Это распространение является причиной значительной потери CpG и расширения генома. [59] Однако этот результат анализируется с течением времени, поскольку более старые элементы Alus показывают большую потерю CpG в участках соседней ДНК по сравнению с более молодыми.
{{cite book}}
: |journal=
проигнорировано ( помощь ){{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ){{cite journal}}
: CS1 maint: дата и год ( ссылка )