Вычислительная эпигенетика

Метилирование ДНК — это эпигенетический механизм, который можно изучать с помощью биоинформатики.

Вычислительная эпигенетика [1] использует статистические методы и математическое моделирование в эпигенетических исследованиях. В связи с недавним взрывом наборов данных эпигенома вычислительные методы играют все большую роль во всех областях эпигенетических исследований.

Исследования в области вычислительной эпигенетики включают разработку и применение методов биоинформатики для решения эпигенетических вопросов, а также вычислительный анализ данных и теоретическое моделирование в контексте эпигенетики. Это включает моделирование эффектов метилирования гистонов и CpG-островков ДНК.

Текущие направления исследований

Важность

Вычислительные методы и технологии секвенирования нового поколения (NGS) используются для изучения метилирования ДНК и модификаций гистонов, которые необходимы в исследованиях рака. Высокопроизводительное секвенирование дает ценную информацию об эпигенетических изменениях, а растущий объем этих наборов данных стимулирует постоянное развитие методов биоинформатики для их эффективного управления и анализа. [2]

Необходимы инструменты интеграции данных, которые могут объединять различные типы эпигенетических модификаций и данные -омики (включая транскриптомику, геномику, эпигеномику и протеомику) для получения всестороннего понимания биологических процессов. Это требует стандартизации, аннотации и гармонизации эпигенетических данных, а также улучшения вычислительных и машинных подходов к обучению. [3]

Понимание функциональных последствий эпигенетики в заболеваниях может быть значительно улучшено с помощью инструментов эпигенетического редактирования, таких как технология CRISPR-dCas9. Эти инструменты позволяют точно модифицировать эпигенетические метки в определенных локусах, позволяя исследователям оценивать эффекты этих изменений в клеточных и животных моделях, тем самым дополняя идеи, полученные с помощью вычислительного анализа. [3]

Обработка и анализ данных

Технология «чип-на-чипе»

Были разработаны различные экспериментальные методы для картирования эпигенетической информации по всему геному, [4] наиболее широко используемые из которых ChIP-on-chip , ChIP-seq и бисульфитное секвенирование . Все эти методы генерируют большие объемы данных и требуют эффективных способов обработки данных и контроля качества с помощью биоинформатических методов.

Прогнозы

Значительное количество биоинформатических исследований было посвящено прогнозированию эпигенетической информации из характеристик последовательности генома . Такие прогнозы служат двойной цели. Во-первых, точные прогнозы эпигенома могут в некоторой степени заменить экспериментальные данные, что особенно актуально для недавно обнаруженных эпигенетических механизмов и для видов, отличных от человека и мыши. Во-вторых, алгоритмы прогнозирования строят статистические модели эпигенетической информации из обучающих данных и, следовательно, могут выступать в качестве первого шага к количественному моделированию эпигенетического механизма. Успешное вычислительное прогнозирование метилирования и ацетилирования ДНК и лизина было достигнуто путем сочетания различных признаков. [5] [6]

Применение в эпигенетике рака

Важная роль эпигенетических дефектов при раке открывает новые возможности для улучшения диагностики и терапии. Эти активные области исследований порождают два вопроса, которые особенно поддаются биоинформатическому анализу. Во-первых, имея список геномных регионов, демонстрирующих эпигенетические различия между опухолевыми клетками и контрольными клетками (или между различными подтипами заболеваний), можем ли мы обнаружить общие закономерности или найти доказательства функциональной связи этих регионов с раком? Во-вторых, можем ли мы использовать биоинформатические методы для улучшения диагностики и терапии путем обнаружения и классификации важных подтипов заболеваний?

Новые темы

Первая волна исследований в области вычислительной эпигенетики была обусловлена ​​быстрым прогрессом экспериментальных методов генерации данных, что потребовало адекватных вычислительных методов для обработки данных и контроля качества, побудило исследования по предсказанию эпигенома как средства понимания геномного распределения эпигенетической информации и обеспечило основу для первоначальных проектов по эпигенетике рака . Хотя эти темы будут оставаться основными областями исследований, а само количество эпигенетических данных, получаемых в результате эпигеномных проектов, представляет собой значительную биоинформатическую проблему, в настоящее время появляются несколько дополнительных тем.

  • Эпигенетические регуляторные схемы: обратная разработка регуляторных сетей, которые считывают, записывают и выполняют эпигенетические коды.
  • Популяционная эпигенетика : выявление регуляторных механизмов на основе интеграции данных эпигенома с профилями экспрессии генов и картами гаплотипов для большой выборки из гетерогенной популяции.
  • Эволюционная эпигенетика: изучение регуляции эпигенома у человека (и ее медицинских последствий) путем межвидовых сравнений.
  • Теоретическое моделирование: проверка нашего механистического и количественного понимания эпигенетических механизмов с помощью компьютерного моделирования. [7]
  • Геномные браузеры : разработка нового комплекса веб-сервисов, позволяющих биологам выполнять сложный геномный и эпигеномный анализ в простой в использовании среде геномного браузера.
  • Медицинская эпигенетика: Поиск эпигенетических механизмов, которые играют роль в заболеваниях, отличных от рака, поскольку существуют веские косвенные доказательства того, что эпигенетическая регуляция участвует в психических расстройствах , аутоиммунных заболеваниях и других сложных заболеваниях. [ необходима ссылка ]

Порталы данных и проекты

Порталы и проекты эпигеномных данных
ИмяОписаниеСвязь
Портал данных IHECПредлагает полный список референтных эпигеномов для человека (hg19, hg38) и мышей (mm10).Портал IHEC [2]
Консорциум по картированию эпигеномики NIH ROADMAPПредоставляет карты модификаций гистонов по всему геному, доступности хроматина, метилирования ДНК и экспрессии мРНК в различных типах клеток и тканях человека.Портал ДОРОЖНОЙ КАРТЫ [2]
CEEHRCКанадская инициатива, предоставляющая подробную информацию о человеческих эпигеномах из разных тканей.Портал CEEHRC [2]
ПРОЕКТЕвропейский проект по созданию эпигеномных карт для 100 различных групп крови.Портал BLUEPRINT [2]
КРЕСТ IHECОсновное внимание уделяется референтным геномам эпителиальных, эндотелиальных и репродуктивных клеток человека.Портал CREST [2]
DeepBlueЦентральная база данных, предназначенная для программных операций с эпигенетическими данными, включая перекрытие и агрегацию данных.Портал DeepBlue [2]
Браузер эпигеномаПоставляет референтные последовательности и проекты сборок для различных геномов.Браузер эпигенома [2]
Браузер эпигенома WashUСодержит обширную эпигеномную информацию по различным видам, включая коров и плодовых мушек, а также по людям и мышам.Портал WashU [2]
Проект ENCODEИнициатива, финансируемая Национальным институтом здравоохранения (NIH), направлена ​​на картирование всех функциональных элементов генома человека.Портал ENCODE [2]
GenExpИнтерактивный браузер генома, интегрирующий данные из распределенной системы аннотаций (DAS).Портал GenExp [2]
Целевая группа AHEADСистематическая работа по картированию человеческого эпигенома, создание биоинформатических сетей для справочных руководств, связанных с нормальными тканями.[2]
Консорциум проекта HEPПредоставляет данные эпигенома высокого разрешения для анализа метилирования ДНК у 43 человек.[2] ГЭП
Консорциум проекта HEROICОсновное внимание уделяется высокопроизводительным исследованиям эпигенетической регуляции с использованием различных геномных анализов.ГЕРОИЧЕСКИЙ Портал [2]
dbEMБаза данных, которая изучает роль эпигенетических белков в онкогенезе, содержит данные о мутациях и экспрессии генов в образцах опухолей.Портал dbEM [2]
ЭпиФакторыБаза данных, связывающая определенные эпигенетические факторы с соответствующими генами.Портал EpiFactors [2]
ХЕДДЗанимается хранением и интеграцией наборов данных, связанных с эпигенетическими препаратами.Портал HEDD [2]

Базы данных

Базы данных метилирования ДНК и эпигенетических данных
ИмяОписаниеЦитата
MethDBСодержит информацию о 19 905 данных о содержании метилирования ДНК и 5382 паттернах метилирования для 48 видов, 1511 особей, 198 тканей и клеточных линий и 79 фенотипов.[8]
ПубметСодержит более 5000 записей о метилированных генах при различных типах рака.[9]
ПЕРЕБАЗОВАТЬСодержит более 22 000 генов ДНК-метилтрансфераз, полученных из GenBank.[10]
База данных эпигеномики DeepBlueСодержит эпигеномные данные из более чем 60 000 экспериментов от разных членов IHEC, разделенные на различные эпигенетические метки. DeepBlue также предоставляет API для доступа и обработки данных.[11]
MeInfoTextСодержит информацию о метилировании генов 205 типов рака у человека.[12]
MethPrimerDBСодержит 259 наборов праймеров человека, мыши и крысы для анализа метилирования ДНК.[13]
База данных гистоновСодержит 254 последовательности из гистона H1, 383 из гистона H2, 311 из гистона H2B, 1043 из гистона H3 и 198 из гистона H4, представляющих не менее 857 видов.[14]
ChromDBСодержит 9341 хроматин-ассоциированный белок, включая белки, ассоциированные с РНК-интерференцией, для широкого спектра организмов.[15]
КРЕМОФАКСодержит 1725 избыточных и 720 не избыточных последовательностей факторов ремоделирования хроматина у эукариот.[16]
Лаборатория эпигенетики семьи КрембильСодержит данные по метилированию ДНК хромосом 21, 22 человека, мужских половых клеток, а также профили метилирования ДНК у монозиготных и дизиготных близнецов.[17]
База данных метилирования ДНК MethyLogiXСодержит данные по метилированию ДНК 21-й и 22-й хромосом человека, мужских половых клеток и болезни Альцгеймера с поздним началом.[18]

Источники и дополнительная литература

  • Первоначальная версия этой статьи была основана на обзорной статье по вычислительной эпигенетике, опубликованной в выпуске журнала Bioinformatics за январь 2008 г.: Bock C, Lengauer T (январь 2008 г.). "Вычислительная эпигенетика". Bioinformatics . 24 (1): 1– 10. doi : 10.1093/bioinformatics/btm546 . PMID  18024971.. В обзорной статье содержится более 100 ссылок на научные работы и обширная справочная информация.Значок открытого доступа

Ссылки

  1. ^ Bock C, Lengauer T (январь 2008). «Вычислительная эпигенетика». Биоинформатика . 24 (1): 1– 10. doi : 10.1093/bioinformatics/btm546 . PMID  18024971.
  2. ^ abcdefghijklmnopq Arora I, Tollefsbol TO (март 2021 г.). «Вычислительные методы и подходы к секвенированию следующего поколения для анализа эпигенетических данных: профилирование методов и приложений». Методы . 187 : 92–103 . doi :10.1016/j.ymeth.2020.09.008. PMC 7914156. PMID  32941995 . 
  3. ^ ab Santaló J, Berdasco M (март 2022 г.). «Этические последствия эпигенетики в эпоху персонализированной медицины». Клиническая эпигенетика . 14 (1): 44. doi : 10.1186/s13148-022-01263-1 . PMC 8953972. PMID  35337378 . 
  4. ^ Мадригал П., Краевский П. (июль 2015 г.). «Раскрытие коррелированной изменчивости в эпигеномных наборах данных с использованием преобразования Карунена-Лоэва». BioData Mining . 8 : 20. doi : 10.1186/s13040-015-0051-7 . PMC 4488123. PMID  26140054 . 
  5. ^ Shi SP, Qiu JD, Sun XY, Suo SB, Huang SY, Liang RP (апрель 2012 г.). "PLMLA: прогнозирование метилирования и ацетилирования лизина путем объединения нескольких признаков". Molecular BioSystems . 8 (5): 1520– 1527. doi :10.1039/C2MB05502C. PMID  22402705. S2CID  6172534.
  6. ^ Чжэн Х, Цзян СВ, У Х (2011). «Улучшение предсказательной силы модели прогнозирования метилирования геномной ДНК человека». Biocomp'11 : Международная конференция по биоинформатике и вычислительной биологии 2011 года. S2CID  14599625.
  7. ^ Roznovăţ IA, Ruskin HJ (сентябрь 2013 г.). «Вычислительная модель для генетических и эпигенетических сигналов при раке толстой кишки». Interdisciplinary Sciences, Computational Life Sciences . 5 (3): 175– 186. doi :10.1007/s12539-013-0172-y. PMID  24307409. S2CID  11867110.
  8. ^ База данных метилирования ДНК
  9. ^ Pubmeth.Org
  10. ^ «Официальная домашняя страница REBASE | База данных рестрикционных ферментов | NEB».
  11. ^ «Сервер эпигеномных данных DeepBlue».
  12. ^ "MeInfoText: связанная информация о метилировании генов и раке из текстового интеллектуального анализа". Архивировано из оригинала 2016-03-03 . Получено 2010-01-29 .
  13. ^ "methPrimerDB: база данных праймеров ПЦР для анализа метилирования ДНК". Архивировано из оригинала 2014-07-15 . Получено 2010-01-29 .
  14. ^ "База данных гистонов - База данных гистонов". Архивировано из оригинала 2015-09-05 . Получено 2010-01-29 .
  15. ^ "ChromDB::Chromatin Database". Архивировано из оригинала 2019-04-10 . Получено 2010-01-29 .
  16. ^ Кремофак
  17. ^ "Главная". epigenomics.ca .
  18. ^ База данных метилирования. Архивировано 03.12.2008 на Wayback Machine.
Взято с "https://en.wikipedia.org/w/index.php?title=Вычислительная_эпигенетика&oldid=1253578678"