Байесовский инструмент для анализа метилирования

Байесовский инструмент для анализа метилирования , также известный как BATMAN , является статистическим инструментом для анализа профилей иммунопреципитации метилированной ДНК (MeDIP). Его можно применять к большим наборам данных, созданным с использованием либо массивов олигонуклеотидов (MeDIP-chip), либо секвенирования следующего поколения (MeDIP-seq), обеспечивая количественную оценку абсолютного состояния метилирования в интересующей области. [1]

Рабочий процесс Бэтмена

Теория

MeDIP (иммунопреципитация метилированной ДНК) — это экспериментальный метод оценки уровней метилирования ДНК с использованием антитела для выделения метилированных последовательностей ДНК. Изолированные фрагменты ДНК либо гибридизуются с микрочипом (MeDIP-chip), либо секвенируются с помощью секвенирования следующего поколения (MeDIP-seq). Хотя это и говорит вам, какие области генома метилированы , это не дает абсолютных уровней метилирования. Представьте себе два разных геномных региона, A и B. Регион A имеет шесть CpG (метилирование ДНК в соматических клетках млекопитающих обычно происходит в динуклеотидах CpG [2] ), три из которых метилированы. Регион B имеет три CpG, все из которых метилированы. Поскольку антитело просто распознает метилированную ДНК , оно будет связывать оба этих региона одинаково, и последующие шаги, следовательно, будут показывать одинаковые сигналы для этих двух регионов. Это не дает полной картины метилирования в этих двух регионах (в регионе A метилирована только половина CpG, тогда как в регионе B метилированы все CpG). Поэтому, чтобы получить полную картину метилирования для данного региона, вам необходимо нормализовать сигнал, который вы получаете от эксперимента MeDIP, по количеству CpG в регионе, и именно это делает алгоритм Batman . Анализ сигнала MeDIP в приведенном выше примере даст баллы Batman 0,5 для региона A (т. е. регион метилирован на 50%) и 1 для региона B (т. е. регион метилирован на 100%). Таким образом, Batman преобразует сигналы из экспериментов MeDIP в абсолютные уровни метилирования.

Развитие Бэтмена

Основной принцип алгоритма Batman заключается в моделировании эффектов различной плотности динуклеотидов CpG и их влияния на обогащение фрагментов ДНК MeDIP. Основные предположения Batman:

  1. Почти все метилирование ДНК у млекопитающих происходит в динуклеотидах CpG.
  2. Большинство регионов с низким содержанием CpG постоянно метилированы, в то время как большинство регионов с высоким содержанием CpG (островки CpG) постоянно неметилированы. [3]
  3. В эксперименте MeDIP нет смещений фрагментов (приблизительный диапазон размеров фрагментов ДНК составляет 400–700 п.н.).
  4. Ошибки на микрочипе обычно распределены с точностью.
  5. Только метилированные CpG вносят вклад в наблюдаемый сигнал.
  6. Состояние метилирования CpG, как правило, сильно коррелирует на протяжении сотен оснований [4] , поэтому CpG, сгруппированные вместе в окнах размером 50 или 100 пар оснований, будут иметь одинаковое состояние метилирования.

Основные параметры в Batman:

  1. C cp : фактор связи между зондом p и динуклеотидом CpG c , определяется как доля молекул ДНК, гибридизующихся с зондом p , которые содержат CpG  c .
  2. C tot  : общий параметр влияния CpG, определяется как сумма факторов связи для любого заданного зонда, которая обеспечивает измерение локальной плотности CpG.
  3. m c  : статус метилирования в позиции c , который представляет собой долю хромосом в образце, на которых он метилирован. m c рассматривается как непрерывная переменная, поскольку большинство образцов, используемых в исследованиях MeDIP, содержат несколько типов клеток.

Исходя из этих предположений, сигнал от канала MeDIP эксперимента MeDIP-chip или MeDIP-seq зависит от степени обогащения фрагментов ДНК, перекрывающих этот зонд, что в свою очередь зависит от количества связывания антител и, таким образом, от количества метилированных CpG на этих фрагментах. В модели Batman полный набор данных из эксперимента MeDIP/chip, A, может быть представлен статистической моделью в виде следующего распределения вероятностей :

ф ( А м ) = п ϕ ( А п А база + г с С с п , ν 1 ) , {\displaystyle f(A\mid m)=\prod _{p}\phi \left(A_{p}\mid A_{\text{base}}+r\sum _{c}C_{cp},\nu ^{-1}\right),}

где ( x | μσ 2 ) — гауссовская функция плотности вероятности . Стандартные байесовские методы могут быть использованы для вывода f ( m | A ), то есть распределения вероятных состояний метилирования с учетом одного или нескольких наборов выходных данных MeDIP-chip/MeDIP-seq. Чтобы решить эту проблему вывода, Бэтмен использует вложенную выборку (http://www.inference.phy.cam.ac.uk/bayesys/) для генерации 100 независимых выборок из f ( m | A ) для каждой мозаичной области генома, затем суммирует наиболее вероятное состояние метилирования в окнах размером 100 пар оснований, подгоняя бета-распределения к этим выборкам. Моды наиболее вероятных бета-распределений использовались в качестве окончательных вызовов метилирования. ϕ {\displaystyle \фи}

Ограничения

При рассмотрении возможности использования Бэтмена может быть полезно принять во внимание следующие моменты:

  1. Batman — это не часть программного обеспечения ; это алгоритм, выполняемый с использованием командной строки . Как таковой, он не особенно удобен для пользователя и представляет собой довольно вычислительно-технический процесс.
  2. Поскольку игра некоммерческая, по использованию Batman предоставляется очень мало информации, выходящей за рамки руководства.
  3. Это довольно трудоемко (анализ одной хромосомы может занять несколько дней). (Примечание: в одной правительственной лаборатории запуск Batman на наборе из 100 матриц метилирования человеческой ДНК Agilent (около 250 000 зондов на матрицу) занял менее часа в программном обеспечении Agilent Genomic Workbench. Наш компьютер имел процессор 2 ГГц, 24 ГБ ОЗУ, 64-разрядную версию Windows 7.)
  4. Необходимо учитывать вариацию числа копий (CNV). Например, балл для региона со значением CNV 1,6 при раке (потеря 0,4 по сравнению с нормой) должен быть умножен на 1,25 (=2/1,6), чтобы компенсировать потерю.
  5. Одно из основных предположений Бэтмена заключается в том, что все метилирование ДНК происходит в динуклеотидах CpG. Хотя это обычно касается соматических клеток позвоночных , существуют ситуации, когда широко распространено не-CpG метилирование, например, в растительных клетках и эмбриональных стволовых клетках . [5] [6]

Ссылки

  1. ^ Down, TA et al. Байесовская стратегия деконволюции для анализа метилома ДНК на основе иммунопреципитации. Nature Biotechnology 26 , 779–85 (2008).
  2. ^ Lister, R. et al . Метиломы ДНК человека при разрешении оснований показывают широко распространенные эпигеномные различия. Nature 462 , 315–22 (2009).
  3. ^ Берд, А. Паттерны метилирования ДНК и эпигенетическая память. Гены и развитие 16 , 6–21 (2002).
  4. ^ Экхардт, Ф. и др . Профилирование метилирования ДНК хромосом 6, 20 и 22 человека. Nature Genetics 38 , 1378–85 (2006).
  5. ^ Dodge, JE, Ramsahoye, BH, Wo, ZG, Okano, M. и Li, E. Метилирование de novo провируса MMLV в эмбриональных стволовых клетках: метилирование CpG против метилирования не-CpG. Gene 289 , 41–8 (2002)
  6. ^ Ванюшин, Б. Ф. Метилирование ДНК у растений. Актуальные темы микробиологии и иммунологии 301 , 67–122 (2006)
Взято с "https://en.wikipedia.org/w/index.php?title=Байесовский_инструмент_для_анализа_метилирования&oldid=942012962"