TIGRFAMs — это база данных семейств белков , разработанная для поддержки ручной и автоматизированной аннотации генома . [1] [2] [3] Каждая запись включает множественное выравнивание последовательностей и скрытую марковскую модель (HMM), построенную на основе выравнивания. Последовательности, которые набирают больше определенных пороговых значений для данной модели TIGRFAM HMM, относятся к этому семейству белков и могут быть отнесены к соответствующим аннотациям. Большинство моделей описывают семейства белков, обнаруженные в бактериях и археях.
Как и Pfam , TIGRFAMs использует пакет HMMER, написанный Шоном Эдди. [4]
История
Первоначально TIGRFAMs был создан в Институте геномных исследований (TIGR) и его преемнике, Институте Дж. Крейга Вентера (JCVI), но в апреле 2018 года он переехал в Национальный центр биотехнологической информации (NCBI). TIGRFAMs остается базой данных участников в InterPro . Последняя версия от JCVI, выпуск 15.0, содержала 4488 моделей. TIGRFAMs теперь продолжается в NCBI как часть более крупной коллекции HMM, называемых NCBIFAMs, используемых в его конвейерах аннотации генома RefSeq и PGAP. [5] Активное курирование и пересмотр моделей TIGRFAMs продолжаются в NCBI, но создание моделей TIGRFAMs как таковых закончилось, поскольку вновь созданные HMM из группы RefSeq получают разные обозначения при добавлении в NCBIFAMs.
Ссылки
^ Хафт, Д. Х.; Селенгут, Дж. Д.; Уайт, О. (2003 ) . «База данных семейств белков TIGRFAM». Nucleic Acids Research . 31 (1): 371– 3. doi :10.1093/nar/gkg128. PMC 165575. PMID 12520025.
^ Selengut, JD; Haft, DH; Davidsen, T; Ganapathy, A; Gwinn-Giglio, M; Nelson, WC; Richter, AR; White, O (2007). "TIGRFAM и свойства генома: инструменты для назначения молекулярной функции и биологического процесса в прокариотических геномах". Nucleic Acids Research . 35 (выпуск базы данных): D260–4. doi :10.1093/nar/gkl1043. PMC 1781115. PMID 17151080 .
^ Хафт, Д. Х.; Селенгут, Дж. Д.; Рихтер, РА; Харкинс, Д. М.; Басу, МК; Бек, Э. (2012). «TIGRFAM и свойства генома в 2013 году». Nucleic Acids Research . 41 (выпуск базы данных): D387-95. doi :10.1093/nar/gks1234. PMC 3531188. PMID 23197656 .
^ Эдди, SR (2009). «Новое поколение инструментов поиска гомологии на основе вероятностного вывода». Геномная информатика. Международная конференция по геномной информатике . 23 (1): 205–11 . PMID 20180275.
^ Li W, O'Neill KR, Haft DH, DiCuccio M, Chetvernin V, Badretdin A; et al. (2021). «RefSeq: расширение охвата конвейера аннотации прокариотического генома с помощью курирования модели семейства белков». Nucleic Acids Res . 49 (D1): D1020 – D1028 . doi :10.1093/nar/gkaa1105. PMC 7779008. PMID 33270901 .{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )