Библиотеки прыжков или библиотеки фрагментов соединений представляют собой коллекции фрагментов геномной ДНК , созданные путем прыжков хромосом . Эти библиотеки позволяют анализировать большие области генома и преодолевать ограничения расстояния в обычных методах клонирования. Клон библиотеки прыжков состоит из двух участков ДНК, которые обычно расположены на расстоянии многих килобаз друг от друга. Участок ДНК, расположенный между этими двумя «концами», удаляется серией биохимических манипуляций, выполняемых в начале этого метода клонирования.
Хромосомный прыжок (или скачок хромосом) был впервые описан в 1984 году Коллинзом и Вайсманом. [1] В то время методы клонирования позволяли создавать клоны ограниченного размера (до 240 кб), а цитогенетические методы позволяли картировать такие клоны в небольшой области конкретной хромосомы с разрешением около 5-10 Мб. Таким образом, оставался большой разрыв в разрешении между доступными технологиями, и не было методов для картирования более крупных областей генома. [1]
Эта техника является расширением «хромосомной прогулки», которая позволяет делать более крупные «шаги» вдоль хромосомы. Если требуются шаги длиной N кб, необходима ДНК с очень высокой молекулярной массой. После выделения она частично расщепляется часто разрезающим рестриктазой ( например, MboI или BamHI ). Затем отбираются полученные фрагменты по размеру, который должен быть около N кб в длину. Затем ДНК должна быть лигирована при низкой концентрации, чтобы способствовать лигированию в круги, а не образованию мультимеров. ДНК-маркер (например, ген янтарного супрессора тРНК supF) может быть включен в этот момент времени в ковалентно связанный круг, чтобы обеспечить выбор фрагментов соединения. Затем круги полностью расщепляются вторым рестриктазой (например, EcoRI ), чтобы получить большое количество фрагментов. Такие фрагменты лигируются в векторы (например, вектор λ), которые должны быть выбраны для использования введенного ранее ДНК-маркера. Таким образом, оставшиеся фрагменты представляют собой библиотеку фрагментов соединения или «прыгающую библиотеку». [1] Следующий шаг — скрининг этой библиотеки с помощью зонда, представляющего собой «начальную точку» желаемого «хромосомного прыжка», т. е. определения местоположения исследуемого генома. Клоны, полученные на этом последнем этапе отбора, будут состоять из ДНК, гомологичной нашему зонду, отделенной нашим маркером ДНК от другой последовательности ДНК, которая изначально находилась на расстоянии N кб (и поэтому называется «прыгающей»). [1] Создав несколько библиотек с различными значениями N, в конечном итоге можно картировать весь геном, что позволяет перемещаться из одного места в другое, контролируя направление с помощью любого желаемого значения N. [1]
Оригинальная методика прыжка хромосом была разработана в лабораториях Коллинза и Вайсмана в Йельском университете в Нью-Хейвене, США [1] и лабораториях Пустки и Лехраха в Европейской лаборатории молекулярной биологии в Гейдельберге, Германия. [2]
Метод Коллинза и Вайсмана [1], описанный выше, столкнулся с некоторыми ранними ограничениями. Основная проблема заключалась в том, чтобы избежать нециркуляризованных фрагментов. Было предложено два решения: либо скрининг фрагментов соединения с помощью заданного зонда, либо добавление второго шага выбора размера после лигирования для отделения отдельных кольцевых клонов (мономеров) от клонов, лигированных друг с другом (мультимеров). Авторы также предложили рассмотреть другие маркеры, такие как сайт λ cos или гены устойчивости к антибиотикам (вместо гена янтарной супрессорной тРНК), чтобы облегчить отбор клонов соединения.
Пустка и Лехрах [2] предложили использовать полное расщепление редкоразрезающими рестриктазами (такими как NotI) на первом этапе построения библиотеки вместо частичного расщепления часторазрезающим рестриктазой. Это значительно сократит количество клонов с миллионов до тысяч. Однако это может создать проблемы с кольцевым расщеплением фрагментов ДНК, поскольку эти фрагменты будут очень длинными, а также потеряет гибкость в выборе конечных точек, которую можно получить при частичном расщеплении. Одним из предложений по преодолению этих проблем было бы объединение двух методов, т. е. построение прыгающей библиотеки из фрагментов ДНК, частично расщепленных обычно режущим рестриктазой и полностью редко режущим рестриктазой, и кольцевание их в плазмиды, расщепленные обоими ферментами. Несколько таких «комбинированных» библиотек были завершены в 1986 году. [2] [3]
В 1991 году Забаровский и др. [4] предложили новый подход к построению прыгающих библиотек. Этот подход включал использование двух отдельных λ-векторов для построения библиотеки и реакцию частичного заполнения, которая устраняет необходимость в селективном маркере. Эта реакция заполнения работала путем разрушения специфических липких концов (полученных в результате рестрикционных переваров) фрагментов ДНК, которые были нелигированы и нециркуляризованы, тем самым предотвращая их клонирование в векторы более энергоэффективным и точным образом. Более того, эта улучшенная техника требовала меньше ДНК для начала, а также производила библиотеку, которую можно было перевести в плазмидную форму, что облегчало ее хранение и репликацию. Используя этот новый подход, они успешно построили человеческую NotI jumping library из лимфобластоидной клеточной линии и человеческую NotI jumping library, специфичную для хромосомы 3, из человеческой хромосомы 3 и мышиной гибридной клеточной линии. [4]
Методы второго поколения или «следующего поколения» (NGS) радикально эволюционировали: возможности секвенирования возросли более чем в десять тысяч раз, а стоимость снизилась более чем в миллион раз с 2007 года (Национальный институт исследований генома человека). NGS произвел революцию в области генетики во многих отношениях.
Библиотека часто готовится путем случайной фрагментации ДНК и лигирования общих последовательностей адаптеров. [5] [6] Однако полученные короткие прочтения затрудняют идентификацию структурных вариантов, таких как индели, транслокации и дупликации. Большие области простых повторов могут еще больше усложнить выравнивание. [7] В качестве альтернативы можно использовать прыгающую библиотеку с NGS для картирования структурных вариаций и построения каркасов de novo сборок. [8]
Библиотеки прыжков можно классифицировать по длине включенных фрагментов ДНК.
В библиотеке коротких прыжков 3-килобайтные фрагменты геномной ДНК лигируются с биотинилатными концами и кольцевидируются. Затем кольцевые сегменты разрезаются на небольшие фрагменты, а биотинилированные фрагменты отбираются с помощью анализа сродства для секвенирования парных концов.
С библиотеками коротких переходов связаны две проблемы. Во-первых, считывание может проходить через биотинилированный кольцевой переход и уменьшать эффективную длину считывания. Во-вторых, считывания с неперепрыгнутых фрагментов (т. е. фрагментов без кольцевого перехода) секвенируются и уменьшают геномное покрытие. Сообщалось, что неперепрыгнутые фрагменты составляют от 4% до 13% в зависимости от размера выборки. Первую проблему можно решить, разрезая круги до большего размера и выбирая эти более крупные фрагменты. Вторую проблему можно решить, используя пользовательскую библиотеку переходов со штрихкодом. [9] [10]
Эта библиотека прыжков использует адаптеры, содержащие маркеры для выбора фрагментов в сочетании со штрихкодами для мультиплексирования. Протокол был разработан Тальковски и др. [9] и основан на подготовке библиотеки парных пар для секвенирования SOLiD. Выбранный размер фрагмента ДНК составляет 3,5–4,5 кб. Были задействованы два адаптера: один, содержащий сайт распознавания EcoP15I и выступ AC; другой, содержащий выступ GT, биотинилированный тимин и олиго штрихкод. Циркулярная ДНК была переварена, и фрагменты с биотинилированными адаптерами были отобраны для (см. Рисунок 3). Сайт распознавания EcoP15I и штрихкод помогают отличать фрагменты соединения от фрагментов без прыжков. Эти целевые фрагменты должны содержать от 25 до 27 п.н. геномной ДНК, сайт распознавания EcoP15I, выступ и штрихкод. [9]
Этот процесс построения библиотеки аналогичен процессу построения библиотеки коротких переходов, за исключением того, что условие оптимизировано для более длинных фрагментов (5 кб). [10]
Этот процесс построения библиотеки также похож на процесс построения библиотеки short-jump, за исключением того, что для амплификации больших (40 кб) фрагментов ДНК требуется трансфекция с использованием вектора E. coli. Кроме того, фосмиды могут быть модифицированы для облегчения преобразования в jumping library, совместимую с определенными секвенаторами следующего поколения. [8] [10]
Сегменты, полученные в результате кольцевания во время построения библиотеки jumping, расщепляются, а фрагменты ДНК с маркерами будут обогащены и подвергнуты парному секвенированию. Эти фрагменты ДНК секвенируются с обоих концов и генерируют пары прочтений. Геномное расстояние между прочтениями в каждой паре приблизительно известно и используется для процесса сборки. Например, клон ДНК, полученный путем случайной фрагментации, составляет около 200 п.н., а прочтение с каждого конца составляет около 180 п.н., перекрывая друг друга. Это следует отличать от секвенирования mate-pair, которое по сути является комбинацией секвенирования следующего поколения с библиотеками jumping.
Для обработки данных библиотеки jumping были разработаны различные инструменты сборки. Одним из примеров является DELLY. DELLY был разработан для обнаружения геномных структурных вариантов и «интегрирует короткие вставки парных концов, дальние пары сопряжения и выравнивания разделенного чтения» для обнаружения перестроек на уровне последовательности. [11]
Примером совместной разработки нового экспериментального проекта и разработки алгоритма является ассемблер ALLPATHS-LG. [12]
При использовании для обнаружения генетических и геномных изменений прыгающие клоны требуют проверки с помощью секвенирования по Сэнгеру .
В ранние дни для идентификации и клонирования генов болезней использовалось хромосомное перемещение от генетически связанных ДНК-маркеров. Однако большое молекулярное расстояние между известными маркерами и интересующим геном усложняло процесс клонирования. В 1987 году была создана библиотека прыжков хромосом человека для клонирования гена кистозного фиброза. Кистозный фиброз является аутосомно-рецессивным заболеванием, поражающим 1 из 2000 представителей европеоидной расы. Это было первое заболевание, при котором была продемонстрирована полезность библиотек прыжков. Онкоген Met был маркером, тесно связанным с геном кистозного фиброза на человеческой хромосоме 7, и библиотека была проверена на наличие прыгающего клона, начинающегося с этого маркера. Было установлено, что ген кистозного фиброза локализуется на 240 кб ниже гена met. Прыжки хромосом помогли сократить «шаги» картирования и обойти высокоповторяющиеся области в геноме млекопитающих. [13] Хромосомные прыжки также позволили создать зонды, необходимые для более быстрой диагностики этого и других заболеваний. [1]
Сбалансированные хромосомные перестройки могут иметь значительный вклад в заболевания, как показали исследования лейкемии. [14] Однако многие из них не обнаруживаются хромосомным микрочипом. Кариотипирование и FISH могут идентифицировать сбалансированные транслокации и инверсии, но они трудоемки и обеспечивают низкое разрешение (небольшие геномные изменения пропускаются).
Для идентификации таких геномных изменений можно применять комбинированный подход Jumping Library NGS. Например, Слэйд и др. применили этот метод для точного картирования сбалансированной транслокации de novo у ребенка с опухолью Вильмса . [15] Для этого исследования было сгенерировано 50 миллионов прочтений, но только 11,6% из них могли быть однозначно сопоставлены с референтным геномом, что составляет примерно шестикратное покрытие.
Тальковски и др. [9] сравнили различные подходы к обнаружению сбалансированных изменений хромосом и показали, что модифицированная библиотека прыжков в сочетании с секвенированием ДНК следующего поколения является точным методом картирования точек разрыва хромосом. Были протестированы две разновидности библиотек прыжков (библиотеки коротких прыжков и пользовательские библиотеки прыжков со штрихкодами), которые были сравнены со стандартными библиотеками секвенирования. Для стандартного NGS генерируются фрагменты размером 200–500 п.н. Около 0,03–0,54% фрагментов представляют собой химерные пары, которые представляют собой пары конечных считываний, сопоставленных с двумя разными хромосомами. Поэтому очень мало фрагментов покрывают область точки разрыва. При использовании библиотек коротких прыжков с фрагментами размером 3,2–3,8 кб процент химерных пар увеличился до 1,3%. С помощью библиотек пользовательских прыжков со штрихкодами процент химерных пар дополнительно увеличился до 1,49%. [9]
Традиционное цитогенетическое тестирование не может обеспечить разрешение на уровне генов, необходимое для прогнозирования исхода беременности, а глубокое секвенирование всего генома непрактично для рутинной пренатальной диагностики. Библиотека прыжков всего генома могла бы дополнить традиционное пренатальное тестирование. Этот новый метод был успешно применен для выявления случая синдрома CHARGE . [6]
В метагеномике области геномов, которые являются общими для штаммов, обычно длиннее, чем прочтения. Это усложняет процесс сборки и делает реконструкцию отдельных геномов для вида сложной задачей. [10] Химерные пары, которые картируются далеко друг от друга в геноме, могут облегчить процесс сборки de novo. Используя библиотеку с более длинными прыжками, Рибейро и др. продемонстрировали, что сборки бактериальных геномов были высокого качества, при этом сокращая как стоимость, так и время. [16]
Стоимость секвенирования резко снизилась, а стоимость создания прыгающих библиотек — нет. Поэтому по мере разработки новых технологий секвенирования и биоинформатических инструментов прыгающие библиотеки могут стать излишними.
{{cite book}}
: |journal=
проигнорировано ( помощь )