Проект по анатомии генома рака

Онлайн-база данных генома

Проект анатомии генома рака ( Cancer Genome Anatomy Project, CGAP ), созданный Национальным институтом рака (NCI) в 1997 году и представленный Элом Гором , представляет собой онлайн-базу данных о нормальных, предраковых и раковых геномах. Он также предоставляет инструменты для просмотра и анализа данных, что позволяет идентифицировать гены, участвующие в различных аспектах прогрессирования опухоли. Цель CGAP — охарактеризовать рак на молекулярном уровне, предоставив платформу с легкодоступными обновленными данными и набором инструментов, чтобы исследователи могли легко соотносить свои выводы с существующими знаниями. Также уделяется внимание разработке программных инструментов, которые улучшают использование больших и сложных наборов данных. [1] [2] Проектом руководит Даниэла С. Герхард, и он включает в себя подпроекты или инициативы, среди которых наиболее заметными являются Проект аберрации хромосом рака (Cancer Chromosome Aberration Project, CCAP) и Инициатива генетической аннотации (Genetic Annotation Initiative, GAI). CGAP вносит вклад во многие базы данных, а такие организации, как NCBI, вносят вклад в базы данных CGAP.

Конечные результаты CGAP включают установление корреляции между прогрессированием конкретного вида рака и его терапевтическим результатом, улучшение оценки лечения и разработку новых методов профилактики, обнаружения и лечения. Это достигается путем характеристики продуктов мРНК биологических тканей.

Исследовать

Фон

Основная причина рака — неспособность клетки регулировать экспрессию генов. Чтобы охарактеризовать определенный тип рака, можно исследовать белки, которые производятся из измененной экспрессии генов или предшественника мРНК белка. CGAP работает над тем, чтобы связать определенный профиль экспрессии клетки , молекулярную подпись или транскриптом , который по сути является отпечатком пальца клетки, с фенотипом клетки. Таким образом, профили экспрессии существуют с учетом типа рака и стадии прогрессирования. [3]

Секвенирование

Первоначальной целью CGAP было создание индекса генов опухолей (TGI) для хранения профилей экспрессии. Это должно было внести вклад как в новые, так и в существующие базы данных. [4] Это способствовало появлению двух типов библиотек: dbEST и позднее dbSAGE. Это было выполнено в несколько этапов: [3]

  • Содержимое клеток промывается над пластинами с последовательностями поли-Т. Это связывает поли-А-хвосты , которые существуют только на молекулах мРНК, тем самым селективно сохраняя мРНК.
  • Изолированная мРНК преобразуется в транскрипт кДНК посредством реакций обратной транскрипции и полимеризации ДНК.
  • Полученная двухцепочечная ДНК затем включается в плазмиды E.coli . Каждая бактерия теперь содержит одну уникальную кДНК и реплицируется для получения клонов с той же генетической информацией. Это называется библиотекой кДНК .
  • Библиотека затем может быть секвенирована с помощью высокопроизводительных методов секвенирования. Это может характеризовать как различные гены, экспрессируемые исходной клеткой, так и количество экспрессии каждого гена.

TGI сначала сосредоточилась на раке простаты, груди, яичников, легких и толстой кишки, а CGAP расширила свои исследования на другие виды рака. На практике возникли проблемы, которые CGAP учел, когда стали доступны новые технологии.

Многие виды рака возникают в тканях с несколькими типами клеток. Традиционные методы брали весь образец ткани и производили библиотеки кДНК ткани. Эта клеточная гетерогенность делала информацию об экспрессии генов с точки зрения биологии рака менее точной. Примером является ткань рака простаты, где эпителиальные клетки, которые, как было показано, являются единственным типом клеток, вызывающим рак, составляют только 10% от общего числа клеток. Это привело к разработке лазерной захватной микродиссекции (LCM), метода, который может изолировать отдельные типы клеток, что давало начало библиотекам кДНК определенных типов клеток. [4]

Секвенирование кДНК даст полный транскрипт мРНК, который ее сгенерировал. Фактически, для уникальной идентификации связанной мРНК или белка требуется только часть последовательности. Полученная часть последовательности была названа экспрессируемой меткой последовательности (EST) и всегда находится в конце последовательности близко к поли А-хвосту. Данные EST хранятся в базе данных под названием dbEST. EST должны быть длиной всего около 400 оснований, но с методами секвенирования NGS это все равно будет давать низкокачественные считывания. Поэтому также используется улучшенный метод, называемый последовательным анализом экспрессии генов (SAGE). Этот метод идентифицирует для каждой молекулы транскрипта кДНК, полученной в результате экспрессии гена клетки, области длиной всего 10-14 оснований в любом месте последовательности считывания, достаточные для уникальной идентификации этого транскрипта кДНК. Эти основания вырезаются и связываются вместе, затем включаются в бактериальные плазмиды, как упоминалось выше. Библиотеки SAGE имеют лучшее качество чтения и генерируют больший объем данных при секвенировании, а поскольку транскрипты сравниваются на абсолютных, а не на относительных уровнях, преимущество SAGE заключается в том, что не требуется нормализация данных путем сравнения с эталоном. [1] [4]

Ресурсы

После секвенирования и создания библиотек CGAP объединяет данные с существующими источниками данных и предоставляет различные базы данных и инструменты для анализа. Подробное описание инструментов и баз данных, созданных или используемых CGAP, можно найти на веб-сайте CGAP NCI. Ниже приведены некоторые инициативы или исследовательские инструменты, предоставленные CGAP.

Инициатива по геномной аннотации

Целью проекта Cancer Genome Anatomy Project Genome Annotation Initiative (CGAP-GAI) является обнаружение и каталогизация однонуклеотидных полиморфизмов (SNP), которые коррелируют с возникновением и прогрессированием рака. [4] CGAP-GAI создали множество инструментов для обнаружения, анализа и отображения SNP. SNP ценны в исследованиях рака, поскольку их можно использовать в нескольких различных генетических исследованиях, обычно для отслеживания передачи, идентификации альтернативных форм генов и анализа сложных молекулярных путей, которые регулируют метаболизм, рост или дифференциацию клеток. [5]

SNP в CGAP-GAI либо обнаруживаются в результате повторного секвенирования интересующих генов у разных людей, либо просматриваются существующие базы данных EST человека и проводятся сравнения. [2] Он изучает транскрипты от здоровых людей, людей с заболеваниями, опухолевые ткани и клеточные линии от большого набора людей; поэтому база данных, скорее всего, будет включать редкие мутации заболеваний в дополнение к высокочастотным вариантам. [6] Распространенной проблемой при обнаружении SNP является дифференциация ошибок секвенирования с фактическими полиморфизмами. Найденные SNP подвергаются статистическому анализу с использованием конвейера CGAP SNP для расчета вероятности того, что вариант на самом деле является полиморфизмом. Высоковероятные SNP проверяются, и существуют инструменты, которые делают прогнозы относительно того, изменена ли функция. [2]

Чтобы сделать данные легкодоступными, CGAP-GAI имеет ряд инструментов, которые могут отображать как выравнивание последовательностей, так и обзор сборки с контекстом последовательностей, из которых они были предсказаны. SNP аннотируются, и часто определяются интегрированные генетические/физические карты. [6]

Проект по изучению хромосомных аберраций рака (CCAP)

Геномная нестабильность является распространенной чертой рака; поэтому понимание структурных и хромосомных аномалий может дать представление о прогрессировании заболевания. Проект по аберрациям хромосом рака (cCAP) — это поддерживаемая CGAP инициатива, используемая для определения структуры хромосом и характеристики перестроек, связанных со злокачественной трансформацией. [4] [7] Он включает в себя онлайн-версию базы данных Мительмана, созданную Феликсом Мительманом, Бертилем Йоханссоном и Фредриком Мертенсом до создания CGAP, еще одного сборника известных хромосомных перестроек. CCAP преследует несколько целей: [7]

  • Интеграция цитогенетических и физических карт генома человека
  • Создать репозиторий клонов BAC по всему геному, которые генетически и физически картированы.
  • Разработать платформу для параллельной корреляции баз данных аберраций, связанных с раком (база данных клонов BAC, картированных с помощью флуоресцентной гибридизации in situ (FISH))
  • Интеграция трех методов цитогенетических анализов (спектральное кариотипирование, сравнительная геномная гибридизация и FISH) для уточнения определяющей номенклатуры кариотипических аберраций.

В базе данных содержится цитогенетическая информация по более чем 64 000 случаям пациентов, включая более 2000 слияний генов. [1]

В рамках этого проекта существует репозиторий физически и цитогенетически картированных клонов BAC для генома человека, которые физически доступны через сеть дистрибьюторов. [1] Карты клонов CCAP были картированы цитогенетически с использованием FISH с разрешением 1-2 Мб по всему геному человека и физически картированы с использованием участков с маркировкой последовательностей (STS). [8] Данные для клонов BAC также доступны через базы данных CGAP и NCBI.

Другие ресурсы

Ниже перечислены некоторые другие ресурсы, доступные через CGAP. [1]

Цифровой дифференциальный дисплей

Ранний метод, используемый CGAP, — это цифровой дифференциальный дисплей (DDD), который использует точный тест Фишера для сравнения библиотек друг с другом, чтобы найти существенные различия между популяциями. CGAP гарантировал, что DDD сможет сравнивать все библиотеки cDNA в dbEST, а не только те, которые были созданы CGAP. [4]

Коллекция генов млекопитающих (MGC)

MGC предоставляет исследователям информацию о полноразмерном белке из cDNA, в отличие от баз данных EST или SAGE, которые предоставляют только идентифицирующую метку. Проект включает гены человека и мыши, а позднее были добавлены коровьи cDNA, созданные Genome Canada . [9]

SAGEmap

SAGEmap — это база данных, используемая для хранения библиотек SAGE. По состоянию на 2001 год существует более 3,4 миллионов тегов SAGE. Инструменты могут использоваться для сопоставления тегов SAGE с кластерами UniGene , базой данных, которая хранит транскриптомы. Это позволяет легче идентифицировать соответствующую последовательность тега SAGE. Кроме того, существуют инструменты, связанные с SAGEmaps: [10]

  • Цифровой северный метод используется для измерения уровня экспрессии определенных генов, [1]
  • SAGE Anatomic Viewer визуально отображает эту информацию и сравнивает ее между нормальными и раковыми клетками,
  • Ludwig Transcript (LT) Viewer показывает альтернативные транскрипты и их возможные связанные теги SAGE,
  • Матрица экспрессии mSAGE (mSEM) показывает уровни экспрессии генов на протяжении всего развития мыши для различных типов тканей.

Генный искатель

CGAP находит ген или список генов на основе указанных критериев поиска и предоставляет ссылки на различные базы данных NCI и NCBI. Ген можно искать конкретно, используя уникальный идентификатор, такой как символы гена и номер гена Entrez, а также, как правило, по функции, ткани или ключевому слову. [11]

Другие генные инструменты, доступные через веб-интерфейс CGAP, включают Gene Ontology Browser (GO) и инструмент Nucleotide BLAST.

Инструменты для экспрессии генов

cDNA xProfiler и cDNA Digital gene expression displayer (DGED) вместе используются для поиска статистически значимых интересующих генов, которые по-разному экспрессируются в двух пулах библиотек cDNA, обычно сравнение проводится между нормальными и раковыми тканями. [12] Статистическая значимость определяется DGED с использованием комбинации байесовской статистики и отношения шансов последовательности для расчета вероятности. cDNA DGED опирается на реляционную базу данных UniGene, в то время как cDNA xProfiler использует базу данных плоских файлов, которая недоступна в Интернете. [13]

Результаты и будущее

CGAP в настоящее время является централизованным местом для нескольких геномных инструментов и генетических баз данных и широко используется в исследованиях рака и молекулярной биологии. Базы данных, созданные CGAP, продолжают вносить вклад в знания о раке с точки зрения его путей и прогрессирования. Базы данных транскриптома также могут использоваться в исследованиях, не связанных с раком, поскольку они содержат информацию, которая может быть использована для быстрой и легкой идентификации определенных секвенированных генов. Данные также имеют клиническое значение, поскольку кДНК могут использоваться для создания микрочипов для диагностики и сравнения методов лечения. CGAP использовался во многих исследованиях, среди примеров которых: [1] [4]

  • Характеристика различий в экспрессии генов нормальных и раковых эндотелиальных клеток [14]
  • Выявление нерегулярной экспрессии генов в качестве маркеров глиобластом [15] и рака яичников [16]
  • Определение экспрессии генов, специфичных для ткани предстательной железы [17]
  • Сравнение белков, экспрессируемых в нормальной и раковой репродуктивной ткани [18]

Кроме того, огромный объем данных, сгенерированных CGAP, побудил к совершенствованию методов анализа и добычи данных, в том числе: [1]

  • Сравнение экспрессии генов из нескольких библиотек кДНК [19]
  • Улучшенные методы добычи библиотек EST [20]
  • Интегральные, масштабные исследования анализа транскриптома человека [21]

Смотрите также

Ссылки

  1. ^ abcdefgh Риггинс, Г. Дж. (2001). «Геном и генетические ресурсы проекта «Анатомия генома рака»». Молекулярная генетика человека . 10 (7): 663–667. doi :10.1093/hmg/10.7.663. ISSN  1460-2083. PMID  11257097.
  2. ^ abc Strausberg, Robert L.; Buetow, Kenneth H.; Emmert-Buck, Michael R.; Klausner, Richard D. (2000). «Проект анатомии генома рака: создание аннотированного индекса генов». Trends in Genetics . 16 (3): 103–106. doi :10.1016/S0168-9525(99)01937-X. ISSN  0168-9525. PMID  10689348.
  3. ^ ab "Понимание рака". Архивировано из оригинала 2014-08-05 . Получено 2014-09-04 .
  4. ^ abcdefg Крицман, Дэвид Б.; Вагнер, Лукас; Лэш, Алекс; Штраусберг, Роберт Л.; Эммерт-Бак, Майкл Р. (1999). «Проект анатомии ракового генома: секвенирование EST и генетика прогрессирования рака». Neoplasia . 1 (2): 101–106. doi :10.1038/sj.neo.7900002. ISSN  1476-5586. PMC 1508126 . PMID  10933042. 
  5. ^ Клиффорд, Р. (2000). «Генетические/физические карты однонуклеотидных полиморфизмов, выявленных в ходе проекта по анатомии ракового генома», основанные на экспрессии». Genome Research . 10 (8): 1259–1265. doi :10.1101/gr.10.8.1259. ISSN  1088-9051. PMC 310932. PMID 10958644  . 
  6. ^ ab Clifford, Robert J.; Edmonson, Michael N.; Nguyen, Cu; Scherpbier, Titia; Hu, Ying; Buetow, Kenneth H. (2004). «Инструменты биоинформатики для обнаружения и анализа полиморфизма отдельных нуклеотидов». Annals of the New York Academy of Sciences . 1020 (1): 101–109. Bibcode : 2004NYASA1020..101C. doi : 10.1196/annals.1310.011. ISSN  0077-8923. PMID  15208187. S2CID  19088027.
  7. ^ ab "Проект по изучению хромосомных аберраций рака (CCAP)" . Получено 05.09.2014 .
  8. ^ "Все о BAC, отображенных с помощью FISH" . Получено 07.09.2014 .
  9. ^ "Коллекция генов млекопитающих". Архивировано из оригинала 2015-02-25 . Получено 2014-09-07 .
  10. ^ "SAGE genie" . Получено 2014-09-07 .
  11. ^ "Gene Finder" . Получено 2014-09-07 .
  12. ^ "CGAP How to: Tools" . Получено 2014-09-07 .
  13. ^ Милнторп, Эндрю Т; Соловьев, Михаил (2011). «Ошибки в CGAP xProfiler и cDNA DGED: важность алгоритмов анализа библиотек и выбора генов». BMC Bioinformatics . 12 (1): 97. doi : 10.1186/1471-2105-12-97 . ISSN  1471-2105. PMC 3094240 . PMID  21496233. 
  14. ^ Croix, B. St. (2000). «Гены, экспрессируемые в эндотелии опухолей человека». Science . 289 (5482): 1197–1202. Bibcode :2000Sci...289.1197S. doi :10.1126/science.289.5482.1197. ISSN  0036-8075. PMID  10947988.
  15. ^ Loging, WT (2000). «Идентификация потенциальных опухолевых маркеров и антигенов с помощью анализа баз данных и быстрого скрининга экспрессии». Genome Research . 10 (9): 1393–1402. doi :10.1101/gr.138000. ISSN  1088-9051. PMC 310902. PMID 10984457  . 
  16. ^ CD Hough; CA Sherman-Baust; ES Pizer; FJ Montz; DD Im; NB Rosenshein; KR Cho; GJ Riggins; PJ Morin (ноябрь 2000 г.). «Крупномасштабный серийный анализ экспрессии генов выявляет гены, дифференциально экспрессируемые при раке яичников». Cancer Research . 60 (22): 6281–6287. PMID  11103784.
  17. ^ G. Vasmatzis; M. Essand; U. Brinkmann; B. Lee; I. Pastan (январь 1998 г.). «Открытие трех генов, специфически экспрессируемых в предстательной железе человека, путем анализа базы данных экспрессируемых последовательностей». Труды Национальной академии наук Соединенных Штатов Америки . 95 (1): 300–304. Bibcode : 1998PNAS...95..300V. doi : 10.1073/pnas.95.1.300 . PMC 18207. PMID  9419370 . 
  18. ^ U. Brinkmann; G. Vasmatzis; B. Lee; N. Yerushalmi; M. Essand; I. Pastan (сентябрь 1998 г.). "PAGE-1, связанный с X-хромосомой ген GAGE-like, который экспрессируется в нормальной и неопластической простате, яичках и матке". Труды Национальной академии наук Соединенных Штатов Америки . 95 (18): 10757–10762. Bibcode : 1998PNAS...9510757B. doi : 10.1073 /pnas.95.18.10757 . PMC 27968. PMID  9724777. 
  19. ^ DJ Stekel; Y. Git; F. Falciani (декабрь 2000 г.). «Сравнение экспрессии генов из нескольких библиотек кДНК». Genome Research . 10 (12): 2055–2061. doi :10.1101/gr.gr-1325rr. PMC 313085. PMID 11116099  . 
  20. ^ Schmitt, AO; Specht, T.; Beckmann, G.; Dahl, E.; Pilarsky, CP; Hinzmann, B.; Rosenthal, A. (1999). «Исчерпывающий анализ библиотек EST для генов, дифференциально экспрессируемых в нормальных и опухолевых тканях». Nucleic Acids Research . 27 (21): 4251–4260. doi :10.1093/nar/27.21.4251. ISSN  0305-1048. PMC 148701 . PMID  10518618. 
  21. ^ В.Е. Велкулеску; С.Л. Мэдден; Л. Чжан; А.Э. Лэш; Дж. Ю; К. Раго; А. Лал; Си Джей Ван; Г.А. Бодри; К.М. Чириелло; Б.П. Кук; г-н Дюфо; АТ Фергюсон; Ю. Гао; ТЦ Он; Х. Хермекинг; СК Хиральдо; Премьер-министр Хван; М. А. Лопес; Х. Ф. Людерер; Б. Мэтьюз; Дж. М. Петрозиелло; К. Поляк; Л. Завель; К.В. Кинцлер (декабрь 1999 г.). «Анализ транскриптомов человека». Природная генетика . 23 (4): 387–388. дои : 10.1038/70487. PMID  10581018. S2CID  29173492.
  • Презентация слайдов CGAP
  • Каталог ресурсов CGAP
Взято с "https://en.wikipedia.org/w/index.php?title=Проект_Анатомии_Генома_Рака&oldid=1246078414"