Базы данных модельных организмов ( МОД ) — это биологические базы данных или базы знаний, предназначенные для предоставления подробных биологических данных для интенсивно изучаемых модельных организмов . МОД позволяют исследователям легко находить справочную информацию о больших наборах генов, эффективно планировать эксперименты, интегрировать свои данные с существующими знаниями и формулировать новые гипотезы. [1] [2] Они позволяют пользователям анализировать результаты и интерпретировать наборы данных, а данные, которые они генерируют, все чаще используются для описания менее изученных видов. [1] Где это возможно, МОД разделяют общие подходы к сбору и представлению биологической информации. Например, все МОД используют Gene Ontology (GO) [3] [4] для описания функций, процессов и клеточного расположения определенных продуктов генов. Существуют также проекты, позволяющие совместно использовать программное обеспечение для курирования, визуализации и запросов между различными МОД. [5] Однако разнообразие организмов и различные требования пользователей означают, что МОД часто требуется настраивать сбор, отображение и предоставление данных. [1]
Типы данных и услуг
Базы данных модельных организмов генерируют, получают и сопоставляют видоспецифическую информацию комплексно, объединяя экспертные знания с подбором литературы и биоинформатикой.
Расположение генов и регуляторных областей в геноме
Функциональное курирование генных продуктов
Распознавать функции, выполняемые продуктом гена, просматривая различные данные, включая аннотации Gene Ontology (GO), фенотипы, экспрессию генов, информацию о путях.
^ abc Oliver SG, Lock A, Harris MA, Nurse P, Wood V (июнь 2016 г.). «Базы данных модельных организмов: основные ресурсы, которым нужна поддержка как спонсоров, так и пользователей». BMC Biology . 14 (1): 49. doi : 10.1186/s12915-016-0276-z . PMC 4918006 . PMID 27334346.
^ Бонд М., Холтхаус С.М., Таммен И., Тир Дж., Рассел С. (ноябрь 2013 г.). «Использование модельных организмов для изучения нейронального цероидного липофусциноза». Biochimica et Biophysica Acta (BBA) - Молекулярные основы болезней . 1832 (11): 1842– 65. doi : 10.1016/j.bbadis.2013.01.009 . ПМИД 23338040.
^ Эшбёрнер М., Болл К. А., Блейк Дж. А., Ботштейн Д., Батлер Х., Черри Дж. М. и др. (май 2000 г.). «Онтология генов: инструмент для объединения биологии. Консорциум по онтологии генов». Nature Genetics . 25 (1): 25– 9. doi :10.1038/75556. PMC 3037419 . PMID 10802651.
^ Gene Ontology Consortium (январь 2015 г.). "Gene Ontology Consortium: going forward" (Консорциум онтологии генов: движение вперед). Nucleic Acids Research . 43 (выпуск базы данных): D1049-56. doi :10.1093/nar/gku1179. PMC 4383973. PMID 25428369 .
^ O'Connor BD, Day A, Cain S, Arnaiz O, Sperling L, Stein LD (2008). "GMODWeb: веб-фреймворк для базы данных Generic Model Organism". Genome Biology . 9 (6): R102. doi : 10.1186/gb-2008-9-6-r102 . PMC 2481422. PMID 18570664 .
^ Cherry JM, Hong EL, Amundsen C, Balakrishnan R, Binkley G, Chan ET и др. (январь 2012 г.). «База данных геномов Saccharomyces: геномный ресурс почкующихся дрожжей». Nucleic Acids Research . 40 (выпуск базы данных): D700-5. doi :10.1093/nar/gkr1029. PMC 3245034. PMID 22110037 .
^ Lock A, Rutherford K, Harris MA, Hayles J, Oliver SG, Bähler J, Wood V (январь 2019 г.). «PomBase 2018: управляемая пользователем повторная реализация базы данных делящихся дрожжей обеспечивает быстрый и интуитивно понятный доступ к разнообразной, взаимосвязанной информации». Nucleic Acids Research . 47 (D1): D821 – D827 . doi :10.1093/nar/gky961. PMC 6324063 . PMID 30321395.
^ Wood V, Harris MA, McDowall MD, Rutherford K, Vaughan BW, Staines DM и др. (январь 2012 г.). "PomBase: всеобъемлющий онлайн-ресурс для делящихся дрожжей". Nucleic Acids Research . 40 (выпуск базы данных): D695-9. doi :10.1093/nar/gkr853. PMC 3245111. PMID 22039153 .
^ McDowall MD, Harris MA, Lock A, Rutherford K, Staines DM, Bähler J, et al. (Январь 2015 г.). "PomBase 2015: обновления базы данных делящихся дрожжей". Nucleic Acids Research . 43 (выпуск базы данных): D656-61. doi :10.1093/nar/gku1040. PMC 4383888. PMID 25361970 .
^ Lock A, Rutherford K, Harris MA, Wood V (2018). "PomBase: Научный ресурс для делящихся дрожжей". Базы данных геномных эукариот . Методы в молекулярной биологии. Том 1757. С. 49–68 . doi :10.1007/978-1-4939-7737-6_4. ISBN978-1-4939-7736-9. PMC 6440643 . PMID 29761456.
^ Karimi K, Fortriede JD, Lotay VS, Burns KA, Wang DZ, Fisher ME и др. (январь 2018 г.). "Xenbase: база данных геномных, эпигеномных и транскриптомных модельных организмов". Nucleic Acids Research . 46 (D1): D861 – D868 . doi :10.1093/nar/gkx936. PMC 5753396 . PMID 29059324.
^ James-Zorn C, Ponferrada VG, Fisher ME, Burns KA, Fortriede JD, Segerdell E, Karimi K, Lotay VS, Wang DZ, Chu S, Pells TJ, Wang Y, Vize PD, Zorn AM (май 2018 г.). «Навигация по Xenbase: интегрированная база данных геномики и экспрессии генов Xenopus». Базы данных генома эукариот . Методы в молекулярной биологии. Том 1757. стр. 251– 305. doi :10.1007/978-1-4939-7737-6_10. ISBN978-1-4939-7736-9. PMC 6853059 . PMID 29761462. {{cite book}}: |journal=проигнорировано ( помощь )
^ Attrill H, Falls K, Goodman JL, Millburn GH, Antonazzo G, Rey AJ, Marygold SJ (январь 2016 г.). "FlyBase: создание ресурса Gene Group для Drosophila melanogaster". Nucleic Acids Research . 44 (D1): D786-92. doi :10.1093/nar/gkv1046. PMC 4702782. PMID 26467478 .
^ Elsik CG, Tayal A, Unni DR, Burns GW, Hagen DE (2018). «База данных геномов перепончатокрылых: использование HymenopteraMine для улучшения геномных исследований перепончатокрылых насекомых». В Kollmar M (ред.). Базы данных геномов эукариот . Методы в молекулярной биологии. Т. 1757. Нью-Йорк, Нью-Йорк: Springer New York. стр. 513– 556. doi :10.1007/978-1-4939-7737-6_17. ISBN978-1-4939-7736-9. PMID 29761469.
^ Eppig JT, Blake JA, Bult CJ, Kadin JA, Richardson JE (январь 2015 г.). «База данных генома мыши (MGD): использование мыши в качестве модели для изучения биологии и болезней человека». Nucleic Acids Research . 43 (выпуск базы данных): D726-36. doi :10.1093/nar/gku967. PMC 4384027. PMID 25348401 .
^ Harris TW, Baran J, Bieri T, Cabunoc A, Chan J, Chen WJ и др. (январь 2014 г.). «WormBase 2014: новые взгляды на кураторскую биологию». Nucleic Acids Research . 42 (выпуск базы данных): D789-93. doi :10.1093/nar/gkt1063. PMC 3965043. PMID 24194605 .
^ Shimoyama M, De Pons J, Hayman GT, Laulederkind SJ, Liu W, Nigam R и др. (январь 2015 г.). «База данных генома крысы 2015: геномные, фенотипические и экологические вариации и заболевания». Nucleic Acids Research . 43 ( выпуск базы данных): D743-50. doi :10.1093/nar/gku1026. PMC 4383884. PMID 25355511.
^ Kreppel L, Fey P, Gaudet P, Just E, Kibbe WA, Chisholm RL, Kimmel AR (январь 2004 г.). "dictyBase: новая база данных генома Dictyostelium discoideum". Nucleic Acids Research . 32 (выпуск базы данных): D332-3. doi :10.1093/nar/gkh138. PMC 308872. PMID 14681427 .
^ Ламеш П., Берардини Т.З., Ли Д., Сварбрек Д., Уилкс С., Сасидхаран Р. и др. (январь 2012 г.). «Информационный ресурс арабидопсиса (TAIR): улучшенная аннотация генов и новые инструменты». Исследования нуклеиновых кислот . 40 (Проблема с базой данных): D1202-10. дои : 10.1093/nar/gkr1090. ПМК 3245047 . ПМИД 22140109.
^ Lawrence CJ, Dong Q, Polacco ML, Seigfried TE, Brendel V (январь 2004 г.). "MaizeGDB, база данных сообщества по генетике и геномике кукурузы". Nucleic Acids Research . 32 (выпуск базы данных): D393-7. doi :10.1093/nar/gkh011. PMC 308746. PMID 14681441 .
^ Andorf CM, Cannon EK, Portwood JL, Gardiner JM, Harper LC, Schaeffer ML и др. (январь 2016 г.). «Обновление MaizeGDB: новые инструменты, данные и интерфейс для базы данных модельных организмов кукурузы». Nucleic Acids Research . 44 (D1): D1195-201. doi :10.1093/nar/gkv1007. PMC 4702771 . PMID 26432828.
^ Грант Д., Нельсон Р. Т., Кэннон С. Б., Шумейкер Р. К. (январь 2010 г.). "SoyBase, база данных генетики и геномики сои USDA-ARS". Nucleic Acids Research . 38 (выпуск базы данных): D843-6. doi :10.1093/nar/gkp798. PMC 2808871. PMID 20008513 .
^ Howe DG, Bradford YM, Conlin T, Eagle AE, Fashena D, Frazer K и др. (январь 2013 г.). "ZFIN, база данных модельных организмов зебровой рыбы: повышенная поддержка мутантов и трансгенов". Nucleic Acids Research . 41 (выпуск базы данных): D854-60. doi :10.1093/nar/gks938. PMC 3531097. PMID 23074187 .
^ Inglis DO, Arnaud MB, Binkley J, Shah P, Skrzypek MS, Wymore F и др. (январь 2012 г.). «База данных геномов Candida включает в себя несколько видов Candida: инструменты поиска и анализа по нескольким видам с курируемой информацией о генах и белках для Candida albicans и Candida glabrata». Nucleic Acids Research . 40 (выпуск базы данных): D667-74. doi :10.1093/nar/gkr945. PMC 3245171. PMID 22064862 .
^ Keseler IM, Mackie A, Peralta-Gil M, Santos-Zavaleta A, Gama-Castro S, Bonavides-Martínez C и др. (январь 2013 г.). "EcoCyc: объединение баз данных модельных организмов с системной биологией". Nucleic Acids Research . 41 (выпуск базы данных): D605-12. doi :10.1093/nar/gks1027. PMC 3531154. PMID 23143106 .
^ Zhu B, Stülke J (январь 2018 г.). «SubtiWiki в 2018 г.: от генов и белков до функциональной сетевой аннотации модельного организма Bacillus subtilis». Nucleic Acids Research . 46 (D1): D743 – D748 . doi :10.1093/nar/gkx908. PMC 5753275. PMID 29788229 .