Вычислительная эпигенетика [1] использует статистические методы и математическое моделирование в эпигенетических исследованиях. В связи с недавним взрывом наборов данных эпигенома вычислительные методы играют все большую роль во всех областях эпигенетических исследований.
Исследования в области вычислительной эпигенетики включают разработку и применение методов биоинформатики для решения эпигенетических вопросов, а также вычислительный анализ данных и теоретическое моделирование в контексте эпигенетики. Это включает моделирование эффектов метилирования гистонов и CpG-островков ДНК.
Вычислительные методы и технологии секвенирования нового поколения (NGS) используются для изучения метилирования ДНК и модификаций гистонов, которые необходимы в исследованиях рака. Высокопроизводительное секвенирование дает ценную информацию об эпигенетических изменениях, а растущий объем этих наборов данных стимулирует постоянное развитие методов биоинформатики для их эффективного управления и анализа. [2]
Необходимы инструменты интеграции данных, которые могут объединять различные типы эпигенетических модификаций и данные -омики (включая транскриптомику, геномику, эпигеномику и протеомику) для получения всестороннего понимания биологических процессов. Это требует стандартизации, аннотации и гармонизации эпигенетических данных, а также улучшения вычислительных и машинных подходов к обучению. [3]
Понимание функциональных последствий эпигенетики в заболеваниях может быть значительно улучшено с помощью инструментов эпигенетического редактирования, таких как технология CRISPR-dCas9. Эти инструменты позволяют точно модифицировать эпигенетические метки в определенных локусах, позволяя исследователям оценивать эффекты этих изменений в клеточных и животных моделях, тем самым дополняя идеи, полученные с помощью вычислительного анализа. [3]
Были разработаны различные экспериментальные методы для картирования эпигенетической информации по всему геному, [4] наиболее широко используемые из которых ChIP-on-chip , ChIP-seq и бисульфитное секвенирование . Все эти методы генерируют большие объемы данных и требуют эффективных способов обработки данных и контроля качества с помощью биоинформатических методов.
Значительное количество биоинформатических исследований было посвящено прогнозированию эпигенетической информации из характеристик последовательности генома . Такие прогнозы служат двойной цели. Во-первых, точные прогнозы эпигенома могут в некоторой степени заменить экспериментальные данные, что особенно актуально для недавно обнаруженных эпигенетических механизмов и для видов, отличных от человека и мыши. Во-вторых, алгоритмы прогнозирования строят статистические модели эпигенетической информации из обучающих данных и, следовательно, могут выступать в качестве первого шага к количественному моделированию эпигенетического механизма. Успешное вычислительное прогнозирование метилирования и ацетилирования ДНК и лизина было достигнуто путем сочетания различных признаков. [5] [6]
Важная роль эпигенетических дефектов при раке открывает новые возможности для улучшения диагностики и терапии. Эти активные области исследований порождают два вопроса, которые особенно поддаются биоинформатическому анализу. Во-первых, имея список геномных регионов, демонстрирующих эпигенетические различия между опухолевыми клетками и контрольными клетками (или между различными подтипами заболеваний), можем ли мы обнаружить общие закономерности или найти доказательства функциональной связи этих регионов с раком? Во-вторых, можем ли мы использовать биоинформатические методы для улучшения диагностики и терапии путем обнаружения и классификации важных подтипов заболеваний?
Первая волна исследований в области вычислительной эпигенетики была обусловлена быстрым прогрессом экспериментальных методов генерации данных, что потребовало адекватных вычислительных методов для обработки данных и контроля качества, побудило исследования по предсказанию эпигенома как средства понимания геномного распределения эпигенетической информации и обеспечило основу для первоначальных проектов по эпигенетике рака . Хотя эти темы будут оставаться основными областями исследований, а само количество эпигенетических данных, получаемых в результате эпигеномных проектов, представляет собой значительную биоинформатическую проблему, в настоящее время появляются несколько дополнительных тем.
Имя | Описание | Связь |
---|---|---|
Портал данных IHEC | Предлагает полный список референтных эпигеномов для человека (hg19, hg38) и мышей (mm10). | Портал IHEC [2] |
Консорциум по картированию эпигеномики NIH ROADMAP | Предоставляет карты модификаций гистонов по всему геному, доступности хроматина, метилирования ДНК и экспрессии мРНК в различных типах клеток и тканях человека. | Портал ДОРОЖНОЙ КАРТЫ [2] |
CEEHRC | Канадская инициатива, предоставляющая подробную информацию о человеческих эпигеномах из разных тканей. | Портал CEEHRC [2] |
ПРОЕКТ | Европейский проект по созданию эпигеномных карт для 100 различных групп крови. | Портал BLUEPRINT [2] |
КРЕСТ IHEC | Основное внимание уделяется референтным геномам эпителиальных, эндотелиальных и репродуктивных клеток человека. | Портал CREST [2] |
DeepBlue | Центральная база данных, предназначенная для программных операций с эпигенетическими данными, включая перекрытие и агрегацию данных. | Портал DeepBlue [2] |
Браузер эпигенома | Поставляет референтные последовательности и проекты сборок для различных геномов. | Браузер эпигенома [2] |
Браузер эпигенома WashU | Содержит обширную эпигеномную информацию по различным видам, включая коров и плодовых мушек, а также по людям и мышам. | Портал WashU [2] |
Проект ENCODE | Инициатива, финансируемая Национальным институтом здравоохранения (NIH), направлена на картирование всех функциональных элементов генома человека. | Портал ENCODE [2] |
GenExp | Интерактивный браузер генома, интегрирующий данные из распределенной системы аннотаций (DAS). | Портал GenExp [2] |
Целевая группа AHEAD | Систематическая работа по картированию человеческого эпигенома, создание биоинформатических сетей для справочных руководств, связанных с нормальными тканями. | [2] |
Консорциум проекта HEP | Предоставляет данные эпигенома высокого разрешения для анализа метилирования ДНК у 43 человек. | [2] ГЭП |
Консорциум проекта HEROIC | Основное внимание уделяется высокопроизводительным исследованиям эпигенетической регуляции с использованием различных геномных анализов. | ГЕРОИЧЕСКИЙ Портал [2] |
dbEM | База данных, которая изучает роль эпигенетических белков в онкогенезе, содержит данные о мутациях и экспрессии генов в образцах опухолей. | Портал dbEM [2] |
ЭпиФакторы | База данных, связывающая определенные эпигенетические факторы с соответствующими генами. | Портал EpiFactors [2] |
ХЕДД | Занимается хранением и интеграцией наборов данных, связанных с эпигенетическими препаратами. | Портал HEDD [2] |
Имя | Описание | Цитата |
---|---|---|
MethDB | Содержит информацию о 19 905 данных о содержании метилирования ДНК и 5382 паттернах метилирования для 48 видов, 1511 особей, 198 тканей и клеточных линий и 79 фенотипов. | [8] |
Пубмет | Содержит более 5000 записей о метилированных генах при различных типах рака. | [9] |
ПЕРЕБАЗОВАТЬ | Содержит более 22 000 генов ДНК-метилтрансфераз, полученных из GenBank. | [10] |
База данных эпигеномики DeepBlue | Содержит эпигеномные данные из более чем 60 000 экспериментов от разных членов IHEC, разделенные на различные эпигенетические метки. DeepBlue также предоставляет API для доступа и обработки данных. | [11] |
MeInfoText | Содержит информацию о метилировании генов 205 типов рака у человека. | [12] |
MethPrimerDB | Содержит 259 наборов праймеров человека, мыши и крысы для анализа метилирования ДНК. | [13] |
База данных гистонов | Содержит 254 последовательности из гистона H1, 383 из гистона H2, 311 из гистона H2B, 1043 из гистона H3 и 198 из гистона H4, представляющих не менее 857 видов. | [14] |
ChromDB | Содержит 9341 хроматин-ассоциированный белок, включая белки, ассоциированные с РНК-интерференцией, для широкого спектра организмов. | [15] |
КРЕМОФАК | Содержит 1725 избыточных и 720 не избыточных последовательностей факторов ремоделирования хроматина у эукариот. | [16] |
Лаборатория эпигенетики семьи Крембиль | Содержит данные по метилированию ДНК хромосом 21, 22 человека, мужских половых клеток, а также профили метилирования ДНК у монозиготных и дизиготных близнецов. | [17] |
База данных метилирования ДНК MethyLogiX | Содержит данные по метилированию ДНК 21-й и 22-й хромосом человека, мужских половых клеток и болезни Альцгеймера с поздним началом. | [18] |