Полиморфизм длины концевых рестрикционных фрагментов ( TRFLP или иногда T-RFLP ) — это метод молекулярной биологии для профилирования микробных сообществ на основе положения сайта рестрикции, ближайшего к маркированному концу амплифицированного гена. Метод основан на переваривании смеси ПЦР- амплифицированных вариантов одного гена с использованием одного или нескольких рестрикционных ферментов и определении размера каждого из полученных отдельных концевых фрагментов с использованием секвенатора ДНК . Результатом является графическое изображение, где ось x представляет размеры фрагмента, а ось y представляет их интенсивность флуоресценции.
TRFLP — один из нескольких молекулярных методов, направленных на создание отпечатка неизвестного микробного сообщества. Другие похожие методы включают DGGE, TGGE , ARISA , ARDRA , PLFA и т. д.
Эти относительно высокопроизводительные методы были разработаны для того, чтобы снизить стоимость и усилия при анализе микробных сообществ с использованием библиотеки клонов . Метод был впервые описан Аванисс-Агхаджани и др. в 1994 году [1] , а затем Лю в 1997 году [2] , который использовал амплификацию целевого гена 16S рДНК из ДНК нескольких изолированных бактерий, а также образцов окружающей среды.
С тех пор метод применялся для использования других маркерных генов, таких как функциональный маркерный ген pmoA, для анализа метанотрофных сообществ.
Как и большинство других методов анализа сообществ, TRFLP также основан на ПЦР-амплификации целевого гена. В случае TRFLP амплификация выполняется с одним или обоими праймерами, имеющими свой 5'-конец, помеченный флуоресцентной молекулой. В случае, если помечены оба праймера, требуются различные флуоресцентные красители . Хотя для маркировки можно использовать несколько распространенных флуоресцентных красителей, таких как 6-карбоксифлуоресцеин (6-FAM), ROX, карбокситетраметилродамин (TAMRA, краситель на основе родамина ) и гексахлорфлуоресцеин (HEX), наиболее широко используемым красителем является 6-FAM. Затем смесь ампликонов подвергается реакции рестрикции, обычно с использованием четырехрезакового рестриктазы . После реакции рестрикции смесь фрагментов разделяется с помощью капиллярного или полиакриламидного электрофореза в секвенаторе ДНК, а размеры различных концевых фрагментов определяются детектором флуоресценции . Поскольку вырезаемая смесь ампликонов анализируется в секвенаторе, считываются только концевые фрагменты (т. е. маркированный конец или концы ампликона), а все остальные фрагменты игнорируются. Таким образом, T-RFLP отличается от ARDRA и RFLP , в которых визуализируются все рестрикционные фрагменты. В дополнение к этим этапам протокол TRFLP часто включает очистку продуктов ПЦР перед рестрикцией, а в случае использования капиллярного электрофореза перед запуском образца также выполняется этап обессоливания.
Результатом профилирования T-RFLP является график, называемый электрофореграммой , который является графиком интенсивности электрофореза ( гелевого или капиллярного). В электрофореграмме ось X отмечает размеры фрагментов, а ось Y отмечает интенсивность флуоресценции каждого фрагмента. Таким образом, то, что отображается на электрофорезном геле как полоса, отображается как пик на электрофореграмме, интегралом которого является его общая флуоресценция. В профиле T-RFLP каждый пик предположительно соответствует одному генетическому варианту в исходном образце, в то время как его высота или площадь соответствуют его относительному распространению в конкретном сообществе. Однако оба перечисленных выше предположения не всегда выполняются. Часто несколько различных бактерий в популяции могут давать один пик на электрофореграмме из-за наличия сайта рестрикции для конкретного рестриктазы, используемого в эксперименте, в том же положении. Чтобы преодолеть эту проблему и увеличить разрешающую способность этой техники, один образец может быть параллельно обработан несколькими ферментами (часто тремя), что приводит к трем профилям T-RFLP на образец, каждый из которых разрешает некоторые варианты, пропуская другие. Другая модификация, которая иногда используется, заключается в флуоресцентной маркировке обратного праймера с использованием другого красителя, что снова приводит к двум параллельным профилям на образец, каждый из которых разрешает разное количество вариантов.
В дополнение к схождению двух различных генетических вариантов в один пик могут также появляться артефакты, в основном в виде ложных пиков. Ложные пики обычно бывают двух типов: фоновые «шумы» и «псевдо» TRF. [3] Фоновые (шумовые) пики — это пики, возникающие из-за чувствительности используемого детектора. Эти пики часто имеют небольшую интенсивность и обычно создают проблему в случае, если общая интенсивность профиля низкая (т. е. низкая концентрация ДНК). Поскольку эти пики возникают из-за фонового шума, они обычно невоспроизводимы в профилях реплик, поэтому проблему можно решить, создав консенсусный профиль из нескольких реплик или исключив пики ниже определенного порога. Для решения этой проблемы также было введено несколько других вычислительных методов. [4] Псевдо TRF, с другой стороны, являются воспроизводимыми пиками и линейны по отношению к количеству загруженной ДНК. Предполагается, что эти пики являются результатом отжига одноцепочечной ДНК на себя и создания двухцепочечных случайных участков рестрикции, которые позже распознаются рестриктазой, что приводит к образованию терминального фрагмента, который не представляет собой какой-либо подлинный генетический вариант. Было высказано предположение, что применение экзонуклеазы ДНК, такой как экзонуклеаза бобов мунг, до стадии переваривания может устранить такой артефакт.
Данные, полученные с помощью электрофореграммы, обычно интерпретируются одним из следующих способов.
При сравнении образцов сравниваются общие формы электрофореграмм различных образцов на предмет таких изменений, как наличие-отсутствие пиков между обработками, их относительный размер и т. д.
Если библиотека клонов создается параллельно с анализом T-RFLP, то клоны можно использовать для оценки и интерпретации профиля T-RFLP. В этом методе TRF каждого клона определяется либо напрямую (т. е. путем проведения анализа T-RFLP на каждом отдельном клоне), либо с помощью анализа in silico последовательности этого клона. Сравнивая профиль T-RFLP с библиотекой клонов, можно подтвердить подлинность каждого пика, а также оценить относительное обилие каждого варианта в библиотеке.
Несколько компьютерных приложений пытаются связать пики в электрофореграмме с определенными бактериями в базе данных. Обычно этот тип анализа выполняется путем одновременного разрешения нескольких профилей одного образца, полученных с различными рестриктазами. Затем программное обеспечение разрешает профиль, пытаясь максимизировать совпадения между пиками в профилях и записями в базе данных, так что количество пиков, оставшихся без соответствующей последовательности, становится минимальным. Программное обеспечение изымает из базы данных только те последовательности, которые имеют свои TRF во всех проанализированных профилях.
Недавно растущим способом анализа профилей T-RFLP является использование многомерных статистических методов для интерпретации данных T-RFLP. [5] Обычно применяемые методы — это те, которые широко используются в экологии и особенно в изучении биоразнообразия. Среди них наиболее широко используются ординации и кластерный анализ . Для выполнения многомерного статистического анализа данных T-RFLP данные сначала необходимо преобразовать в таблицу, известную как «таблица выборки по видам», которая отображает различные образцы (профили T-RFLP) в сравнении с видами (T-RFS) с высотой или площадью пиков в качестве значений.
Поскольку T-RFLP представляет собой метод дактилоскопии , его преимущества и недостатки часто обсуждаются в сравнении с другими аналогичными методами, в основном DGGE.
Главным преимуществом T-RFLP является использование автоматизированного секвенатора, который дает высоковоспроизводимые результаты для повторных образцов. Хотя генетические профили не полностью воспроизводимы, а несколько второстепенных пиков, которые появляются, невоспроизводимы, общая форма электрофореграммы и соотношения основных пиков считаются воспроизводимыми. Использование автоматизированного секвенатора, который выводит результаты в цифровом числовом формате, также позволяет легко хранить данные и сравнивать различные образцы и эксперименты. Числовой формат данных может и использовался для относительной (хотя и не абсолютной) количественной оценки и статистического анализа. Хотя данные о последовательностях не могут быть окончательно выведены непосредственно из профиля T-RFLP, в определенной степени возможно назначение пиков существующим последовательностям ''in-silico''.
Поскольку T-RFLP опирается на методы экстракции ДНК и ПЦР, присущие обоим методам смещения повлияют на результаты анализа. [6] [7] Кроме того, тот факт, что считываются только концевые фрагменты, означает, что любые две отдельные последовательности, которые разделяют конечный сайт рестрикции, приведут к одному пику только на электрофореграмме и будут неразличимы. Действительно, когда T-RFLP применяется к сложному микробному сообществу, результатом часто является сжатие общего разнообразия до обычно 20-50 отдельных пиков, каждый из которых представляет только неизвестное количество отдельных последовательностей. Хотя это явление упрощает обработку результатов T-RFLP, оно, естественно, вносит смещения и чрезмерное упрощение реального разнообразия. Попытки минимизировать (но не преодолеть) эту проблему часто предпринимаются путем применения нескольких рестриктаз и/или маркировки обоих праймеров различным флуоресцентным красителем. Невозможность извлечения последовательностей из T-RFLP часто приводит к необходимости конструировать и анализировать одну или несколько библиотек клонов параллельно с анализом T-RFLP, что добавляет усилий и усложняет анализ. Возможное появление ложных (псевдо) T-RF, как обсуждалось выше, является еще одним недостатком. Чтобы справиться с этим, исследователи часто рассматривают только пики, которые могут быть связаны с последовательностями в библиотеке клонов.