Библиотека прыжков

На этом рисунке показан основной принцип, лежащий в основе прыжковых библиотек. Стрелки представляют собой две физически удаленные последовательности, которые сближаются с помощью этого метода.

Библиотеки прыжков или библиотеки фрагментов соединений представляют собой коллекции фрагментов геномной ДНК , созданные путем прыжков хромосом . Эти библиотеки позволяют анализировать большие области генома и преодолевать ограничения расстояния в обычных методах клонирования. Клон библиотеки прыжков состоит из двух участков ДНК, которые обычно расположены на расстоянии многих килобаз друг от друга. Участок ДНК, расположенный между этими двумя «концами», удаляется серией биохимических манипуляций, выполняемых в начале этого метода клонирования.

Изобретение и первые усовершенствования

Источник

Хромосомный прыжок (или скачок хромосом) был впервые описан в 1984 году Коллинзом и Вайсманом. [1] В то время методы клонирования позволяли создавать клоны ограниченного размера (до 240 кб), а цитогенетические методы позволяли картировать такие клоны в небольшой области конкретной хромосомы с разрешением около 5-10 Мб. Таким образом, оставался большой разрыв в разрешении между доступными технологиями, и не было методов для картирования более крупных областей генома. [1]

Основной принцип и оригинальный метод

На этом рисунке схематически представлен метод создания прыгающих библиотек, который был первоначально разработан в 80-х годах.

Эта техника является расширением «хромосомной прогулки», которая позволяет делать более крупные «шаги» вдоль хромосомы. Если требуются шаги длиной N кб, необходима ДНК с очень высокой молекулярной массой. После выделения она частично расщепляется часто разрезающим рестриктазой ( например, MboI или BamHI ). Затем отбираются полученные фрагменты по размеру, который должен быть около N кб в длину. Затем ДНК должна быть лигирована при низкой концентрации, чтобы способствовать лигированию в круги, а не образованию мультимеров. ДНК-маркер (например, ген янтарного супрессора тРНК supF) может быть включен в этот момент времени в ковалентно связанный круг, чтобы обеспечить выбор фрагментов соединения. Затем круги полностью расщепляются вторым рестриктазой (например, EcoRI ), чтобы получить большое количество фрагментов. Такие фрагменты лигируются в векторы (например, вектор λ), которые должны быть выбраны для использования введенного ранее ДНК-маркера. Таким образом, оставшиеся фрагменты представляют собой библиотеку фрагментов соединения или «прыгающую библиотеку». [1] Следующий шаг — скрининг этой библиотеки с помощью зонда, представляющего собой «начальную точку» желаемого «хромосомного прыжка», т. е. определения местоположения исследуемого генома. Клоны, полученные на этом последнем этапе отбора, будут состоять из ДНК, гомологичной нашему зонду, отделенной нашим маркером ДНК от другой последовательности ДНК, которая изначально находилась на расстоянии N кб (и поэтому называется «прыгающей»). [1] Создав несколько библиотек с различными значениями N, в конечном итоге можно картировать весь геном, что позволяет перемещаться из одного места в другое, контролируя направление с помощью любого желаемого значения N. [1]

Ранние проблемы и улучшения

Оригинальная методика прыжка хромосом была разработана в лабораториях Коллинза и Вайсмана в Йельском университете в Нью-Хейвене, США [1] и лабораториях Пустки и Лехраха в Европейской лаборатории молекулярной биологии в Гейдельберге, Германия. [2]

Метод Коллинза и Вайсмана [1], описанный выше, столкнулся с некоторыми ранними ограничениями. Основная проблема заключалась в том, чтобы избежать нециркуляризованных фрагментов. Было предложено два решения: либо скрининг фрагментов соединения с помощью заданного зонда, либо добавление второго шага выбора размера после лигирования для отделения отдельных кольцевых клонов (мономеров) от клонов, лигированных друг с другом (мультимеров). Авторы также предложили рассмотреть другие маркеры, такие как сайт λ cos или гены устойчивости к антибиотикам (вместо гена янтарной супрессорной тРНК), чтобы облегчить отбор клонов соединения.

Пустка и Лехрах [2] предложили использовать полное расщепление редкоразрезающими рестриктазами (такими как NotI) на первом этапе построения библиотеки вместо частичного расщепления часторазрезающим рестриктазой. Это значительно сократит количество клонов с миллионов до тысяч. Однако это может создать проблемы с кольцевым расщеплением фрагментов ДНК, поскольку эти фрагменты будут очень длинными, а также потеряет гибкость в выборе конечных точек, которую можно получить при частичном расщеплении. Одним из предложений по преодолению этих проблем было бы объединение двух методов, т. е. построение прыгающей библиотеки из фрагментов ДНК, частично расщепленных обычно режущим рестриктазой и полностью редко режущим рестриктазой, и кольцевание их в плазмиды, расщепленные обоими ферментами. Несколько таких «комбинированных» библиотек были завершены в 1986 году. [2] [3]

В 1991 году Забаровский и др. [4] предложили новый подход к построению прыгающих библиотек. Этот подход включал использование двух отдельных λ-векторов для построения библиотеки и реакцию частичного заполнения, которая устраняет необходимость в селективном маркере. Эта реакция заполнения работала путем разрушения специфических липких концов (полученных в результате рестрикционных переваров) фрагментов ДНК, которые были нелигированы и нециркуляризованы, тем самым предотвращая их клонирование в векторы более энергоэффективным и точным образом. Более того, эта улучшенная техника требовала меньше ДНК для начала, а также производила библиотеку, которую можно было перевести в плазмидную форму, что облегчало ее хранение и репликацию. Используя этот новый подход, они успешно построили человеческую NotI jumping library из лимфобластоидной клеточной линии и человеческую NotI jumping library, специфичную для хромосомы 3, из человеческой хромосомы 3 и мышиной гибридной клеточной линии. [4]

Текущий метод

Методы второго поколения или «следующего поколения» (NGS) радикально эволюционировали: возможности секвенирования возросли более чем в десять тысяч раз, а стоимость снизилась более чем в миллион раз с 2007 года (Национальный институт исследований генома человека). NGS произвел революцию в области генетики во многих отношениях.

Строительство библиотеки

Библиотека часто готовится путем случайной фрагментации ДНК и лигирования общих последовательностей адаптеров. [5] [6] Однако полученные короткие прочтения затрудняют идентификацию структурных вариантов, таких как индели, транслокации и дупликации. Большие области простых повторов могут еще больше усложнить выравнивание. [7] В качестве альтернативы можно использовать прыгающую библиотеку с NGS для картирования структурных вариаций и построения каркасов de novo сборок. [8]

На этом рисунке схематически представлен один из самых последних методов создания прыгающих библиотек.

Библиотеки прыжков можно классифицировать по длине включенных фрагментов ДНК.

Библиотека коротких прыжков

В библиотеке коротких прыжков 3-килобайтные фрагменты геномной ДНК лигируются с биотинилатными концами и кольцевидируются. Затем кольцевые сегменты разрезаются на небольшие фрагменты, а биотинилированные фрагменты отбираются с помощью анализа сродства для секвенирования парных концов.

С библиотеками коротких переходов связаны две проблемы. Во-первых, считывание может проходить через биотинилированный кольцевой переход и уменьшать эффективную длину считывания. Во-вторых, считывания с неперепрыгнутых фрагментов (т. е. фрагментов без кольцевого перехода) секвенируются и уменьшают геномное покрытие. Сообщалось, что неперепрыгнутые фрагменты составляют от 4% до 13% в зависимости от размера выборки. Первую проблему можно решить, разрезая круги до большего размера и выбирая эти более крупные фрагменты. Вторую проблему можно решить, используя пользовательскую библиотеку переходов со штрихкодом. [9] [10]

Библиотека прыжков со штрих-кодом

Эта библиотека прыжков использует адаптеры, содержащие маркеры для выбора фрагментов в сочетании со штрихкодами для мультиплексирования. Протокол был разработан Тальковски и др. [9] и основан на подготовке библиотеки парных пар для секвенирования SOLiD. Выбранный размер фрагмента ДНК составляет 3,5–4,5 кб. Были задействованы два адаптера: один, содержащий сайт распознавания EcoP15I и выступ AC; другой, содержащий выступ GT, биотинилированный тимин и олиго штрихкод. Циркулярная ДНК была переварена, и фрагменты с биотинилированными адаптерами были отобраны для (см. Рисунок 3). Сайт распознавания EcoP15I и штрихкод помогают отличать фрагменты соединения от фрагментов без прыжков. Эти целевые фрагменты должны содержать от 25 до 27 п.н. геномной ДНК, сайт распознавания EcoP15I, выступ и штрихкод. [9]

Библиотека прыжков в длину

Этот процесс построения библиотеки аналогичен процессу построения библиотеки коротких переходов, за исключением того, что условие оптимизировано для более длинных фрагментов (5 кб). [10]

Библиотека Fosmid-jump

Этот процесс построения библиотеки также похож на процесс построения библиотеки short-jump, за исключением того, что для амплификации больших (40 кб) фрагментов ДНК требуется трансфекция с использованием вектора E. coli. Кроме того, фосмиды могут быть модифицированы для облегчения преобразования в jumping library, совместимую с определенными секвенаторами следующего поколения. [8] [10]

Парноконцевое секвенирование

Сегменты, полученные в результате кольцевания во время построения библиотеки jumping, расщепляются, а фрагменты ДНК с маркерами будут обогащены и подвергнуты парному секвенированию. Эти фрагменты ДНК секвенируются с обоих концов и генерируют пары прочтений. Геномное расстояние между прочтениями в каждой паре приблизительно известно и используется для процесса сборки. Например, клон ДНК, полученный путем случайной фрагментации, составляет около 200 п.н., а прочтение с каждого конца составляет около 180 п.н., перекрывая друг друга. Это следует отличать от секвенирования mate-pair, которое по сути является комбинацией секвенирования следующего поколения с библиотеками jumping.

Вычислительный анализ

Для обработки данных библиотеки jumping были разработаны различные инструменты сборки. Одним из примеров является DELLY. DELLY был разработан для обнаружения геномных структурных вариантов и «интегрирует короткие вставки парных концов, дальние пары сопряжения и выравнивания разделенного чтения» для обнаружения перестроек на уровне последовательности. [11]

Примером совместной разработки нового экспериментального проекта и разработки алгоритма является ассемблер ALLPATHS-LG. [12]

Подтверждение

При использовании для обнаружения генетических и геномных изменений прыгающие клоны требуют проверки с помощью секвенирования по Сэнгеру .

Приложения

Ранние заявки

В ранние дни для идентификации и клонирования генов болезней использовалось хромосомное перемещение от генетически связанных ДНК-маркеров. Однако большое молекулярное расстояние между известными маркерами и интересующим геном усложняло процесс клонирования. В 1987 году была создана библиотека прыжков хромосом человека для клонирования гена кистозного фиброза. Кистозный фиброз является аутосомно-рецессивным заболеванием, поражающим 1 из 2000 представителей европеоидной расы. Это было первое заболевание, при котором была продемонстрирована полезность библиотек прыжков. Онкоген Met был маркером, тесно связанным с геном кистозного фиброза на человеческой хромосоме 7, и библиотека была проверена на наличие прыгающего клона, начинающегося с этого маркера. Было установлено, что ген кистозного фиброза локализуется на 240 кб ниже гена met. Прыжки хромосом помогли сократить «шаги» картирования и обойти высокоповторяющиеся области в геноме млекопитающих. [13] Хромосомные прыжки также позволили создать зонды, необходимые для более быстрой диагностики этого и других заболеваний. [1]

Новые приложения

Характеристика хромосомных перестроек

Сбалансированные хромосомные перестройки могут иметь значительный вклад в заболевания, как показали исследования лейкемии. [14] Однако многие из них не обнаруживаются хромосомным микрочипом. Кариотипирование и FISH могут идентифицировать сбалансированные транслокации и инверсии, но они трудоемки и обеспечивают низкое разрешение (небольшие геномные изменения пропускаются).

Для идентификации таких геномных изменений можно применять комбинированный подход Jumping Library NGS. Например, Слэйд и др. применили этот метод для точного картирования сбалансированной транслокации de novo у ребенка с опухолью Вильмса . [15] Для этого исследования было сгенерировано 50 миллионов прочтений, но только 11,6% из них могли быть однозначно сопоставлены с референтным геномом, что составляет примерно шестикратное покрытие.

Тальковски и др. [9] сравнили различные подходы к обнаружению сбалансированных изменений хромосом и показали, что модифицированная библиотека прыжков в сочетании с секвенированием ДНК следующего поколения является точным методом картирования точек разрыва хромосом. Были протестированы две разновидности библиотек прыжков (библиотеки коротких прыжков и пользовательские библиотеки прыжков со штрихкодами), которые были сравнены со стандартными библиотеками секвенирования. Для стандартного NGS генерируются фрагменты размером 200–500 п.н. Около 0,03–0,54% фрагментов представляют собой химерные пары, которые представляют собой пары конечных считываний, сопоставленных с двумя разными хромосомами. Поэтому очень мало фрагментов покрывают область точки разрыва. При использовании библиотек коротких прыжков с фрагментами размером 3,2–3,8 кб процент химерных пар увеличился до 1,3%. С помощью библиотек пользовательских прыжков со штрихкодами процент химерных пар дополнительно увеличился до 1,49%. [9]

Пренатальная диагностика

Традиционное цитогенетическое тестирование не может обеспечить разрешение на уровне генов, необходимое для прогнозирования исхода беременности, а глубокое секвенирование всего генома непрактично для рутинной пренатальной диагностики. Библиотека прыжков всего генома могла бы дополнить традиционное пренатальное тестирование. Этот новый метод был успешно применен для выявления случая синдрома CHARGE . [6]

Новая сборка

В метагеномике области геномов, которые являются общими для штаммов, обычно длиннее, чем прочтения. Это усложняет процесс сборки и делает реконструкцию отдельных геномов для вида сложной задачей. [10] Химерные пары, которые картируются далеко друг от друга в геноме, могут облегчить процесс сборки de novo. Используя библиотеку с более длинными прыжками, Рибейро и др. продемонстрировали, что сборки бактериальных геномов были высокого качества, при этом сокращая как стоимость, так и время. [16]

Ограничение

Стоимость секвенирования резко снизилась, а стоимость создания прыгающих библиотек — нет. Поэтому по мере разработки новых технологий секвенирования и биоинформатических инструментов прыгающие библиотеки могут стать излишними.

Смотрите также

Ссылки

  1. ^ abcdefgh Коллинз, FS; Вайсман, SM (ноябрь 1984). «Направленное клонирование фрагментов ДНК на большом расстоянии от исходного зонда: метод циркуляризации». Труды Национальной академии наук Соединенных Штатов Америки . 81 (21): 6812–6. Bibcode : 1984PNAS...81.6812C. doi : 10.1073/pnas.81.21.6812 . PMC  392022. PMID  6093122 .
  2. ^ abc Poustka, Annemarie; Lehrach, Hans (1 января 1986 г.). «Прыгающие библиотеки и связывающие библиотеки: следующее поколение молекулярных инструментов в генетике млекопитающих». Trends in Genetics . 2 : 174–179. doi :10.1016/0168-9525(86)90219-2.
  3. ^ Poustka, A; Pohl, TM; Barlow, DP; Frischauf, AM; Lehrach, H (22–28 января 1987 г.). «Конструирование и использование библиотек прыжков хромосом человека из переваренной NotI ДНК». Nature . 325 (6102): 353–5. Bibcode :1987Natur.325..353P. doi :10.1038/325353a0. PMID  3027567. S2CID  4241410.
  4. ^ ab Zabarovsky, ER; Boldog, F; Erlandsson, R; Kashuba, VI; Allikmets, RL; Marcsek, Z; Kisselev, LL; Stanbridge, E; Klein, G; Sumegi, J (декабрь 1991 г.). "Новая стратегия картирования генома человека на основе новой процедуры построения прыгающих библиотек". Genomics . 11 (4): 1030–9. doi :10.1016/0888-7543(91)90029-e. PMID  1783374.
  5. ^ Шендуре, Дж.; Джи, Х. (октябрь 2008 г.). «Секвенирование ДНК следующего поколения». Nature Biotechnology . 26 (10): 1135–45. doi :10.1038/nbt1486. ​​PMID  18846087. S2CID  6384349.
  6. ^ ab Talkowski, ME; Ordulu, Z; Pillalamarri, V; Benson, CB; Blumenthal, I; Connolly, S; Hanscom, C; Hussain, N; Pereira, S; Picker, J; Rosenfeld, JA; Shaffer, LG; Wilkins-Haug, LE; Gusella, JF; Morton, CC (6 декабря 2012 г.). "Клиническая диагностика с помощью секвенирования всего генома пренатального образца". The New England Journal of Medicine . 367 (23): 2226–32. doi :10.1056/NEJMoa1208594. PMC 3579222. PMID  23215558 . 
  7. ^ Meldrum, C; Doyle, MA; Tothill, RW (ноябрь 2011 г.). «Секвенирование следующего поколения для диагностики рака: практическая перспектива». The Clinical Biochemist. Обзоры / Австралийская ассоциация клинических биохимиков . 32 (4): 177–95. PMC 3219767. PMID  22147957 . 
  8. ^ аб Уильямс, LJS; Таббаа, генеральный директор; Ли, Н.; Берлин, AM; Ши, ТП; МакКаллум, И.; Лоуренс, MS; Драйер, Ю.; Гетц, Г.; Янг, СК; Яффе, Д.Б.; Нусбаум, К.; Гнирке, А. (16 июля 2012 г.). «Парное секвенирование библиотек Fosmid от Illumina». Геномные исследования . 22 (11): 2241–2249. дои : 10.1101/гр.138925.112. ПМЦ 3483553 . ПМИД  22800726. 
  9. ^ abcde Talkowski, ME; Ernst, C; Heilbut, A; Chiang, C; Hanscom, C; Lindgren, A; Kirby, A; Liu, S; Muddukrishna, B; Ohsumi, TK; Shen, Y; Borowsky, MZ; Daly, MJ; Morton, CC; Gusella, JF (8 апреля 2011 г.). «Стратегии секвенирования следующего поколения позволяют проводить рутинное обнаружение сбалансированных перестроек хромосом для клинической диагностики и генетических исследований». American Journal of Human Genetics . 88 (4): 469–81. doi :10.1016/j.ajhg.2011.03.013. PMC 3071919 . PMID  21473983. 
  10. ^ abcd Нагараджан, Ниранджан; Поп, Михай (29 января 2013 г.). «Сборка последовательностей демистифицирована». Nature Reviews Genetics . 14 (3): 157–167. doi :10.1038/nrg3367. PMID  23358380. S2CID  3519991.
  11. ^ Рауш, Т.; Зихнер, Т.; Шлаттл, А.; Штутц, АМ; Бенеш, В.; Корбель, ДЖ.О. (7 сентября 2012 г.). «DELLY: структурное обнаружение вариантов с помощью интегрированного анализа парных концов и расщепленных прочтений». Биоинформатика . 28 ( 18): i333–i339. doi :10.1093/bioinformatics/bts378. PMC 3436805. PMID  22962449. 
  12. ^ Gnerre, S; Maccallum, I; Przybylski, D; Ribeiro, FJ; Burton, JN; Walker, BJ; Sharpe, T; Hall, G; Shea, TP; Sykes, S; Berlin, AM; Aird, D; Costello, M; Daza, R; Williams, L; Nicol, R; Gnirke, A; Nusbaum, C; Lander, ES; Jaffe, DB (25 января 2011 г.). «Высококачественные черновики сборок геномов млекопитающих из массивно параллельных данных последовательностей». Труды Национальной академии наук Соединенных Штатов Америки . 108 (4): 1513–8. Bibcode : 2011PNAS..108.1513G. doi : 10.1073/pnas.1017351108 . PMC 3029755. PMID  21187386 . 
  13. ^ Rommens, J.; Iannuzzi, M.; Kerem, B; Drumm, M.; Melmer, G; Dean, M; Rozmahel, R; Cole, J.; Kennedy, D; Hidaka, N; et al. (8 сентября 1989 г.). «Идентификация гена кистозного фиброза: ходьба и прыжки хромосом». Science . 245 (4922): 1059–1065. Bibcode :1989Sci...245.1059R. doi :10.1126/science.2772657. PMID  2772657.
  14. ^ Роули, JD (1979). «Хромосомные аномалии при лейкемии». Современные тенденции в области лейкоза человека III . Гематология и переливание крови / Hämatologie und Bluttransfusion. Том. 23. С. 43–52. дои : 10.1007/978-3-642-67057-2_5. ISBN 978-3-540-08999-5. PMID  232467. {{cite book}}: |journal=проигнорировано ( помощь )
  15. ^ Slade, I.; Stephens, P.; Douglas, J.; Barker, K.; Stebbings, L.; Abbaszadeh, F.; Pritchard-Jones, K.; Cole, R.; Pizer, B.; Stiller, C.; Vujanic, G.; Scott, RH; Stratton, MR; Rahman, N. (30 ноября 2009 г.). «Картирование точек разрыва конституционной транслокации с помощью секвенирования парных концов по всему геному идентифицирует HACE1 как предполагаемый ген восприимчивости к опухоли Вильмса». Journal of Medical Genetics . 47 (5): 342–347. doi :10.1136/jmg.2009.072983. PMID  19948536. S2CID  24354213.
  16. ^ Рибейро, Ф. Дж.; Пржибыльский, Д.; Ин, С.; Шарп, Т.; Гнерр, С.; Абуэль, А.; Берлин, А. М.; Монмайер, А.; Ши, TP; Уокер, Б. Дж.; Янг, СК; Расс, К.; Нусбаум, К.; Маккаллум, И.; Джаффе, Д. Б. (24 июля 2012 г.). «Завершенные бактериальные геномы из данных дробовика». Genome Research . 22 (11): 2270–2277. doi :10.1101/gr.141515.112. PMC 3483556 . PMID  22829535. 
  • DELLY: Обнаружение структурных вариантов с помощью интегрированного анализа парных концов и разделенного прочтения
  • ALLPATHS-LG: сборка de novo микрочтений всего генома [1]
  1. ^ Батлер, Дж.; Маккаллум, И.; Клебер, М.; Шляхтер, И.А.; Бельмонте, МК; Ландер, Э.С.; Нусбаум, К.; Джаффе, Д.Б. (май 2008 г.). «ALLPATHS: de novo сборка микрочтений всего генома методом дробовика». Genome Research . 18 (5): 810–20. doi :10.1101/gr.7337908. PMC 2336810 . PMID  18340039. 
Получено с "https://en.wikipedia.org/w/index.php?title=Jumping_library&oldid=1220924132"