FAIRE-Seq ( формальдегид - ассистированная изоляция регуляторных элементов ) — метод в молекулярной биологии, используемый для определения последовательностей участков ДНК в геноме, связанных с регуляторной активностью. [1] Метод был разработан в лаборатории Джейсона Д. Либа в Университете Северной Каролины , Чапел- Хилл . В отличие от DNase-Seq , протокол FAIRE-Seq не требует пермеабилизации клеток или изоляции ядер и может анализировать любой тип клеток. В исследовании семи различных типов клеток человека DNase-seq и FAIRE-seq дали сильную перекрестную проверку, при этом каждый тип клеток имел 1-2% человеческого генома в виде открытого хроматина .
Протокол основан на том факте, что формальдегидное сшивание более эффективно в ДНК , связанной с нуклеосомами , чем в обедненных нуклеосомами областях генома. Затем этот метод отделяет не сшитую ДНК, которая обычно находится в открытом хроматине, который затем секвенируется. Протокол состоит из сшивания, экстракции фенолом и секвенирования ДНК в водной фазе.
FAIRE использует биохимические свойства связанной с белком ДНК для разделения обедненных нуклеосомами областей в геноме. Клетки будут подвергнуты сшивке, что гарантирует, что взаимодействие между нуклеосомами и ДНК будет зафиксировано. После обработки ультразвуком фрагментированная и фиксированная ДНК разделяется с помощью экстракции фенол-хлороформом. Этот метод создает две фазы: органическую и водную. Благодаря своим биохимическим свойствам фрагменты ДНК, сшитые с нуклеосомами, будут преимущественно находиться в органической фазе. С другой стороны, обедненные нуклеосомами или «открытые» области будут обнаружены в водной фазе. Благодаря специальному извлечению водной фазы будут очищены и обогащены только обедненные нуклеосомами области. [1]
Извлеченные с помощью FAIRE фрагменты ДНК можно анализировать с высокой пропускной способностью, используя методы секвенирования следующего поколения . В общем, библиотеки создаются путем лигирования определенных адаптеров к фрагментам ДНК, которые позволяют им группироваться на платформе и амплифицироваться, в результате чего последовательности ДНК считываются/определяются, и это происходит параллельно для миллионов фрагментов ДНК.
В зависимости от размера генома, на котором выполняется FAIRE-seq, требуется минимальное количество прочтений для создания соответствующего покрытия данных, что гарантирует определение надлежащего сигнала. [2] [3] Кроме того, эталонный или входной геном, который не был сшит, часто секвенируется рядом для определения уровня фонового шума.
Обратите внимание, что извлеченные фрагменты FAIRE можно количественно оценить альтернативным методом с помощью количественной ПЦР . Однако этот метод не позволяет проводить полногеномную/высокопроизводительную количественную оценку извлеченных фрагментов.
Есть несколько аспектов FAIRE-seq, которые требуют внимания при анализе и интерпретации данных. Во-первых, было заявлено, что FAIRE-seq будет иметь более высокий охват в областях энхансера, чем в областях промотора. [4] Это контрастирует с альтернативным методом DNase-seq, который, как известно, показывает более высокую чувствительность к областям промотора. Кроме того, было заявлено, что FAIRE-seq показывает предпочтение для внутренних интронов и экзонов. [5] В целом также считается, что данные FAIRE-seq показывают более высокий фоновый уровень, что делает его менее чувствительным методом. [6]
На первом этапе данные FAIRE-seq сопоставляются с референсным геномом используемого модельного организма.
Далее, идентификация геномных регионов с открытым хроматином выполняется с помощью алгоритма вызова пика. Различные инструменты предлагают пакеты для этого (например, ChIPOTle [7] ZINBA [8] и MACS2 [9] ). ChIPOTle использует скользящее окно в 300 п.н. для идентификации статистически значимых сигналов. Напротив, MACS2 идентифицирует обогащенный сигнал, комбинируя параметр callpeak с другими опциями, такими как «широкий», «широкий срез», «без модели» или «сдвиг». ZINBA — это общий алгоритм для обнаружения обогащения в наборе данных коротких прочтений. [10] Таким образом, он помогает точно обнаруживать сигнал в сложных наборах данных с низким отношением сигнал/шум.
BedTools [11] используется для объединения обогащенных регионов, расположенных близко друг к другу, для формирования CORE (кластера открытых регуляторных элементов). Это помогает в идентификации доступных хроматину регионов и схем регуляции генов, которые в противном случае были бы необнаружимы, учитывая низкое разрешение, которое часто дает FAIRE-seq.
Данные обычно визуализируются в виде треков (например, bigWig) и могут быть загружены в браузер генома Калифорнийского университета в Санта-Крузе. [12]
Основное ограничение этого метода, а именно низкое отношение сигнал/шум по сравнению с другими анализами доступности хроматина, делает вычислительную интерпретацию этих данных очень сложной. [13]
Существует несколько методов, которые можно использовать в качестве альтернативы FAIRE-seq. DNase-seq использует способность фермента ДНКазы I расщеплять свободную/открытую/доступную ДНК для идентификации и секвенирования открытого хроматина. [14] [15] Разработанный впоследствии ATAC-seq использует транспозазу Tn5, которая вставляет определенные фрагменты или транспозоны в доступные области генома для идентификации и секвенирования открытого хроматина. [16]