Иммунопреципитация метилированной ДНК (MeDIP или mDIP) — это крупномасштабный ( хромосомный или геномный ) метод очистки в молекулярной биологии, который используется для обогащения метилированных последовательностей ДНК . Он заключается в выделении метилированных фрагментов ДНК с помощью антитела, полученного против 5-метилцитозина (5mC). Этот метод был впервые описан Вебером М. и др. [1] в 2005 году и помог проложить путь для жизнеспособных усилий по оценке на уровне метилома , поскольку очищенная фракция метилированной ДНК может быть введена в высокопроизводительные методы обнаружения ДНК, такие как ДНК-микрочипы высокого разрешения ( MeDIP-chip ) или секвенирование следующего поколения (MeDIP-seq). Тем не менее, понимание метилома остается рудиментарным; его изучение осложняется тем фактом, что, как и другие эпигенетические свойства, паттерны различаются от типа клеток к типу клеток.
Метилирование ДНК , относящееся к обратимому метилированию 5-го положения цитозина метилтрансферазами , является основной эпигенетической модификацией в многоклеточных организмах. [2] У млекопитающих эта модификация в основном происходит в сайтах CpG , которые, в свою очередь, имеют тенденцию группироваться в областях, называемых CpG-островками . [3] Существует небольшая часть CpG-островков, которые могут перекрываться или находиться в непосредственной близости от промоторных областей сайтов начала транскрипции. Модификация может также происходить в других сайтах, [4] но метилирование в любом из этих сайтов может подавлять экспрессию генов, либо препятствуя связыванию факторов транскрипции , либо изменяя структуру хроматина до репрессивного состояния. [5]
Исследования состояний болезни в значительной степени подпитывали усилия по пониманию роли метилирования ДНК. В настоящее время основной исследовательский интерес заключается в изучении состояний болезни, таких как рак, для выявления областей ДНК, которые претерпели обширные изменения метилирования. Гены, содержащиеся в этих областях, представляют функциональный интерес, поскольку они могут предложить механистическое объяснение основных генетических причин заболевания. Например, аномальный паттерн метилирования раковых клеток [6] [7] [8] изначально был показан как механизм, посредством которого гены, подобные супрессорам опухолей , подавляются [9] , хотя позже было замечено, что затронут гораздо более широкий диапазон типов генов. [10] [11] [12]
Существует два подхода к анализу метилирования: технологии типирования и профилирования. Технологии типирования нацелены на небольшое количество локусов во многих образцах и включают использование таких методов, как ПЦР , рестриктазы и масс-спектрометрия . Технологии профилирования, такие как MeDIP, нацелены на оценку метилирования на уровне генома или метилома ; это включает геномное сканирование рестрикционных маркеров (RLGS) [13] и методы, основанные на бисульфитной конверсии , которые основаны на обработке ДНК бисульфитом для преобразования неметилированных остатков цитозина в урацил . [14] [15] [16] [17]
Другие методы картирования и профилирования метилома были эффективны, но не лишены своих ограничений, которые могут повлиять на разрешение, уровень пропускной способности или экспериментальные вариации. Например, RLGS ограничен количеством сайтов рестрикции в геноме, которые могут быть целями для рестриктазы; как правило, можно оценить максимум ~4100 ориентиров. [18] Методы, основанные на бисульфитном секвенировании , несмотря на возможное разрешение по одному нуклеотиду, имеют недостаток: преобразование неметилированного цитозина в урацил может быть нестабильным. [19] Кроме того, когда бисульфитное преобразование сочетается с ДНК-микрочипами для обнаружения сайтов, преобразованных бисульфитом, проблемой становится сниженная сложность последовательности ДНК. Микрочипы, способные всесторонне профилировать весь геном, становится трудно разрабатывать, поскольку доступно меньше уникальных зондов. [20]
В следующих разделах описывается метод MeDIP в сочетании с гибридизацией массивов высокого разрешения или высокопроизводительным секвенированием. Каждый метод обнаружения ДНК также кратко описывает постлабораторную обработку и анализ. Требуется различная постобработка необработанных данных в зависимости от технологии, используемой для идентификации метилированных последовательностей. Это аналогично данным, полученным с помощью ChIP-chip и ChIP-seq .
Геномная ДНК извлекается ( экстракция ДНК ) из клеток и очищается. Затем очищенная ДНК подвергается ультразвуковой обработке для ее разрезания на случайные фрагменты. Этот процесс ультразвуковой обработки быстрый, простой и позволяет избежать смещений рестриктаз . Длина полученных фрагментов составляет от 300 до 1000 пар оснований (п. н.), хотя обычно они составляют от 400 до 600 п. н. [21] Короткая длина этих фрагментов важна для получения адекватного разрешения, повышения эффективности последующего этапа иммунопреципитации и снижения эффектов или смещений длины фрагмента. Кроме того, размер фрагмента влияет на связывание антитела 5-метилцитидина (5mC), поскольку для эффективного связывания антителу требуется больше, чем просто один 5mC. [22] Для дальнейшего улучшения сродства связывания антител фрагменты ДНК денатурируют для получения одноцепочечной ДНК. После денатурации ДНК инкубируют с моноклональными антителами 5mC. Затем применяется классический метод иммунопреципитации : магнитные шарики, конъюгированные с антимышиным IgG, используются для связывания анти-5mC антител, а несвязанная ДНК удаляется в супернатанте. Для очистки ДНК добавляется протеиназа К для расщепления антител и высвобождения ДНК, которую можно собрать и подготовить для обнаружения ДНК.
Более подробную информацию об экспериментальных этапах см. [1] [19] [23] [24]
Часть входной ДНК, полученной после этапа обработки ультразвуком, маркируется цианином -5 (Cy5; красный) дезокси-цитозин-трифосфатом, в то время как метилированная ДНК, обогащенная после этапа иммунопреципитации, маркируется цианином -3 (Cy3; зеленый). Образцы маркированной ДНК когибридизуются на 2-канальном геномном микрочипе высокой плотности для зондирования на наличие и относительные количества. Целью этого сравнения является выявление последовательностей, которые показывают значительные различия в уровнях гибридизации, тем самым подтверждая, что интересующая последовательность обогащена. Идентификация последовательностей MeDIP на основе массива ограничена конструкцией массива. В результате разрешение ограничивается зондами в конструкции массива. Существуют дополнительные стандартные шаги, необходимые при обработке сигнала для исправления проблем гибридизации, таких как шум, как в случае с большинством технологий массивов.
Более подробную информацию см. в [23] [24] [25] .
Подход MeDIP-seq, т. е. соединение MeDIP с технологиями секвенирования с короткими прочтениями следующего поколения, такими как пиросеквенирование 454 или Illumina (Solexa), был впервые описан Дауном и др. в 2008 году. [20] Высокопроизводительное секвенирование метилированных фрагментов ДНК производит большое количество коротких прочтений (36-50 п.н. [26] или 400 п.н. [27] в зависимости от технологии). Короткие прочтения выравниваются с эталонным геномом с помощью программного обеспечения для выравнивания, такого как Mapping and Assembly with Quality (Maq), которое использует байесовский подход, а также базовые и картографические качества для моделирования вероятностей ошибок для выравниваний. [28] Затем прочтения можно расширить, чтобы представить фрагменты размером ~400–700 п.н. с этапа ультразвуковой обработки. Охват этих расширенных прочтений можно использовать для оценки уровня метилирования региона. Для визуализации данных можно также использовать геномный браузер, такой как Ensembl .
Валидацию подхода к оценке качества и точности данных можно выполнить с помощью количественной ПЦР . Это делается путем сравнения последовательности из образца MeDIP с неметилированной контрольной последовательностью. Затем образцы прогоняются на геле и сравниваются интенсивности полос. [19] Относительная интенсивность служит руководством для поиска обогащения. Результаты также можно сравнить с результатами MeDIP-чипа, чтобы помочь определить необходимое покрытие.
Оценки уровня метилирования ДНК могут быть искажены из-за различной плотности метилированных сайтов CpG по всему геному при наблюдении за данными, полученными с помощью MeDIP. Это может быть проблематичным для анализа регионов с низким содержанием CpG (более низкой плотности). Одной из причин этой проблемы с плотностью является ее влияние на эффективность иммунопреципитации. В своем исследовании Даун и др. [20] разработали инструмент для оценки абсолютных уровней метилирования из данных, полученных с помощью MeDIP, путем моделирования плотности метилированных сайтов CpG. Этот инструмент называется байесовским инструментом для анализа метилирования (Batman) . В исследовании сообщается об охвате ~90% всех сайтов CpG в промоторах, областях кодирования генов, островах и регуляторных элементах, где можно оценить уровни метилирования; это почти в 20 раз лучшее покрытие, чем у любых предыдущих методов.
Исследования с использованием MeDIP-seq или MeDIP-chip являются подходами, охватывающими весь геном, которые имеют общую цель получения функционального картирования метилома. После того, как области метилирования ДНК идентифицированы, можно применить ряд биоинформатических анализов для ответа на определенные биологические вопросы. Одним из очевидных шагов является исследование генов, содержащихся в этих областях, и изучение функциональной значимости их репрессии. Например, подавление генов-супрессоров опухолей при раке может быть отнесено к метилированию ДНК. [29] Выявляя мутационные события, приводящие к гиперметилированию и последующей репрессии известных генов-супрессоров опухолей, можно более конкретно охарактеризовать факторы, способствующие причине заболевания. В качестве альтернативы можно идентифицировать гены, которые, как известно, обычно метилированы, но в результате некоторого мутационного события больше не подавлены.
Кроме того, можно попытаться исследовать и определить, был ли затронут какой-либо эпигенетический регулятор, такой как ДНК-метилтрансфераза (DNMT); [21] в этих случаях обогащение может быть более ограниченным.
Было показано, что анализ набора генов (например, с использованием таких инструментов, как DAVID и GoSeq) является сильно предвзятым при применении к данным метилирования с высокой пропускной способностью (например, MeDIP-seq и MeDIP-ChIP); было высказано предположение, что это можно исправить с помощью перестановок меток образцов или с помощью статистической модели для контроля различий в количестве зондов CpG / сайтов CpG, нацеленных на каждый ген. [30]
Ограничения, которые следует учитывать при использовании MeDIP, являются типичными экспериментальными факторами. Они включают качество и перекрестную реактивность антител 5mC, используемых в процедуре. Кроме того, методы обнаружения ДНК (т. е. гибридизация массивов и высокопроизводительное секвенирование) обычно включают в себя хорошо известные ограничения. В частности, для процедур на основе массивов, как упоминалось выше, анализируемые последовательности ограничены конкретной используемой конструкцией массива.
Наиболее типичные ограничения применимы к высокопроизводительному секвенированию следующего поколения. Проблема точности выравнивания для повторяющихся областей в геноме приведет к менее точному анализу метилирования в этих областях. Кроме того, как было упомянуто выше, короткие считывания (например, 36-50 п.н. из анализатора генома Illumina) представляют собой часть срезанного фрагмента при выравнивании с геномом; поэтому точный сайт метилирования может попасть в любое место в пределах окна, которое является функцией размера фрагмента. [19] В этом отношении бисульфитное секвенирование имеет гораздо более высокое разрешение (вплоть до одного сайта CpG; уровень одного нуклеотида). Однако этот уровень разрешения может не потребоваться для большинства приложений, поскольку было показано, что статус метилирования сайтов CpG в пределах < 1000 п.н. значительно коррелирует. [20]