Информация в FlyBase поступает из различных источников, начиная от крупномасштабных геномных проектов и заканчивая первичной исследовательской литературой. Эти типы данных включают мутантные фенотипы ; молекулярную характеристику мутантных аллелей ; и другие отклонения, цитологические карты, шаблоны экспрессии дикого типа , анатомические изображения, трансгенные конструкции и вставки, модели генов на уровне последовательности и молекулярную классификацию функций продуктов генов. [2] Инструменты запросов позволяют осуществлять навигацию по FlyBase через последовательность ДНК или белка, по имени гена или мутанта или через термины из нескольких онтологий, используемых для сбора функциональных, фенотипических и анатомических данных. База данных предлагает несколько различных инструментов запросов для обеспечения эффективного доступа к имеющимся данным и облегчения обнаружения значимых взаимосвязей в базе данных. [3] Связи между FlyBase и внешними базами данных, такими как BDGP [4] или modENCODE [5] , предоставляют возможности для дальнейшего изучения других баз данных модельных организмов и других ресурсов биологической и молекулярной информации. [6] Проект FlyBase реализуется консорциумом исследователей дрозофилы и специалистов по информатике из Гарвардского университета и Университета Индианы в США, а также Кембриджского университета в Великобритании.
По состоянию на 2022 год [обновлять]на домашней странице FlyBase запрашивается плата за доступ к веб-сайту в размере 150,00 долларов США с человека в год, при этом указывается, что « NHGRI сократил финансирование FlyBase на 50%» [8] .
Фон
Drosophila melanogaster была экспериментальным организмом с начала 1900-х годов и с тех пор находилась на переднем крае многих областей исследований. [9] Поскольку эта область исследований распространялась и становилась глобальной, исследователям, работающим над теми же проблемами, требовался способ общения и отслеживания прогресса в этой области. Первоначально эта ниша была заполнена общественными информационными бюллетенями, такими как Drosophila Information Service (DIS), которая берет свое начало в 1934 году, когда область начала распространяться из лаборатории Томаса Ханта Моргана . Материалы на этих страницах представляли собой регулярные «каталоги» мутаций и библиографии литературы по Drosophila. По мере развития компьютерной инфраструктуры в 80-х и 90-х годах эти информационные бюллетени уступили место и слились с интернет-списками рассылки, и они в конечном итоге стали онлайн-ресурсами и данными. В 1992 году данные по генетике и геномике D. melanogaster и родственных видов были доступны в электронном виде через Интернет через финансируемые группы информатики FlyBase, BDGP (Berkeley Drosophila Genome Project) и EDGP (European Drosophila Genome Project). Эти группы признали, что большинство типов данных геномных проектов и сообществ пересекаются. Они решили, что будет полезно представить научному сообществу комплексное представление данных. В октябре 1992 года Национальный центр исследований генома человека NIH профинансировал проект FlyBase с целью проектирования, создания и выпуска базы данных генетической и молекулярной информации, касающейся Drosophila melanogaster . FlyBase также получает поддержку от Медицинского исследовательского совета , Лондон. [10] В 1998 году консорциум FlyBase интегрировал информацию в единый сервер геномики Drosophila. По состоянию на 2022 год [обновлять]проект FlyBase осуществлялся консорциумом исследователей дрозофилы и компьютерных специалистов из Гарвардского университета , Кембриджского университета (Великобритания), Университета Индианы и Университета Нью-Мексико . [11]
Содержание
FlyBase содержит полную аннотацию генома Drosophila melanogaster , которая обновляется несколько раз в год. [12] Он также включал в себя поисковую библиографию исследований генетики Drosophila за последний век. Информация о текущих исследователях и частичная родословная отношений между текущими исследователями были доступны для поиска на основе регистрации участвующего ученого. [13] Сайт также предоставляет большую базу данных изображений, иллюстрирующих полный геном, и несколько фильмов, подробно описывающих эмбриогенез (ImageBrowser, архив 2007-03-24 на Wayback Machine ). Двумя основными источниками данных для базы данных являются большие многовидовые наборы данных, размещенные Консорциумом геномов Drosophila 12 (Clark et al 2007) и Crosby et al 2007. [14]
Стратегии поиска — Отчеты о генах для всех двенадцати секвенированных геномов Drosophila доступны в FlyBase. Существует четыре основных способа просмотра этих данных: Предварительно вычисленные файлы [15] BLAST, [16] Gbrowse, [17] и страницы отчетов о генах. Gbrowse и предварительно вычисленные файлы предназначены для анализа всего генома, биоинформатики и сравнительной геномики. BLAST и страницы отчетов о генах предназначены для определенного гена, белка или региона в пределах вида.
При поиске цитологии доступны два основных инструмента. Используйте Cytosearch [18] для поиска цитологически картированных генов или дефицитов, которые не были молекулярно картированы в последовательности. Используйте Gbrowse для поиска молекулярно картированных последовательностей, вставок или зондов Affymetrix.
В FlyBase есть два основных инструмента запросов. Первый основной инструмент запросов называется Jump to Gene (J2G). Он находится в правом верхнем углу синей панели навигации на каждой странице FlyBase. Этот инструмент полезен, когда вы точно знаете, что ищете, и хотите перейти на страницу отчета с этими данными. Второй основной инструмент запросов называется QuickSearch. Он расположен на домашней странице FlyBase. Этот инструмент наиболее полезен, когда вы хотите быстро найти что-то, о чем вы, возможно, знаете лишь немного. Поиск можно выполнять только в пределах D. melanogaster или во всех видах. Данные, отличные от генов, можно искать с помощью меню «класс данных».
Сопутствующие исследования
Ниже приведены два примера исследований, связанных с FlyBase или использующих ее:
Первая — это исследование экспрессированных генов из крылатой (что означает «имеющей крылья») Toxoptera citricida , более известной как коричневая цитрусовая тля. Коричневая цитрусовая тля считается основным переносчиком вируса тристецы цитрусовых , серьезного патогена, который наносит убытки цитрусовым отраслям по всему миру. Крылатая форма этой тли может летать на большие расстояния с ветром, что позволяет ей распространять вирус тристецы цитрусовых в регионах выращивания цитрусовых. Чтобы лучше понять биологию коричневой цитрусовой тли и возникновение генов, экспрессируемых во время развития крыльев, исследователи предприняли масштабный проект по секвенированию 5′-конца кДНК-клонов из крылатых тлей. Аналогичные масштабные проекты по секвенированию экспрессированных последовательностей меток (EST) из других насекомых предоставили средство для ответа на биологические вопросы, связанные с развитием и физиологией. Хотя в GenBank растет база данных EST из насекомых, большинство из них взяты из Drosophila melanogaster, и относительно немногие из них получены специально от тлей. Исследователи смогли предоставить большой набор данных EST из крылатой коричневой цитрусовой тли и начали анализировать этот ценный ресурс. Они смогли сделать это с помощью информации о Drosophila melanogaster в FlyBase. Предполагаемая идентичность последовательностей была определена с помощью поиска BLAST. Совпадения последовательностей с оценками E-value ≤ −10 считались значимыми и были классифицированы в соответствии с системой классификации Gene Ontology (GO) на основе аннотации 5 «лучших совпадений» в поисках BLASTX. Все совпадения D. melanogaster были каталогизированы с помощью FlyBase. Почти все эти «лучшие совпадения» были охарактеризованы в отношении функционально аннотированных генов в D. melanogaster с помощью FlyBase. Генетическая информация имеет решающее значение для углубления понимания биологии тли и будет играть важную роль в разработке будущих нехимических, основанных на генах стратегий контроля против этих насекомых-вредителей. [19]
Улучшение аннотации генной онтологии Drosophila: Что делают генные продукты и где они это делают, являются важными вопросами для биологов. Проект Gene Ontology был основан 13 лет назад для того, чтобы последовательно суммировать эти данные в разных базах данных с использованием общего набора определенных словарных терминов. Они также кодируют отношения между терминами. Проект Gene Ontology является крупной биоинформатической инициативой, направленной на стандартизацию представления атрибутов генов и генных продуктов по видам и базам данных. Проект также предоставляет данные аннотации генных продуктов от членов консорциума GO. [20] FlyBase был одним из трех членов-основателей консорциума Gene Ontology. Аннотация GO состоит как минимум из трех компонентов: термин GO, который описывает молекулярную функцию, биологическую роль или субклеточное расположение; «код доказательства», который описывает тип анализа, используемый для поддержки термина GO; и атрибуция к конкретной ссылке. Аннотация GO полезна как для мелкомасштабных, так и для крупномасштабных анализов. Он может предоставить первое указание на природу генного продукта и, в сочетании с кодами доказательств, напрямую указать на статьи с соответствующими экспериментальными данными. Текущие приоритеты для аннотации: гомологи генов человеческих болезней, гены, которые высококонсервативны у разных видов, гены, участвующие в биохимических/сигнальных путях, и актуальные гены, которые, как было показано в недавних публикациях, представляют значительный интерес. FlyBase вносит аннотации GO в проект с момента его запуска в августе 2006 года. Аннотации GO появляются на странице Gene Report в FlyBase. Данные GO доступны для поиска в FlyBase с использованием как TermLink, так и QueryBuilder. GO является динамичным и может меняться ежедневно, например, добавлять новые термины. Чтобы идти в ногу со временем, FlyBase загружает новую версию GO каждые один или два выпуска FlyBase. Набор аннотаций GO отправляется в GOC одновременно с выпуском новой версии FlyBase. [21]
^ Кросби, Мадлен А. и др. (2007). «FlyBase: Genomes by the Dozen». Nucleic Acids Research . 35 (выпуск базы данных). Oxford Journals: D486 – D491 . doi : 10.1093/nar/gkl827 . PMC 1669768. PMID 17099233 .
^ Wilson, RJ; Goodman, JL; Strelets, VB (2008). «FlyBase: интеграция и улучшения инструментов запросов». Nucleic Acids Res . 36 (выпуск базы данных): D588–93. doi :10.1093/nar/gkm930. PMC 2238994. PMID 18160408 .
^ БДГП
^ модENCODE
^ Драйсдейл, Р. (2008). «FlyBase: База данных для сообщества исследователей дрозофилы». Drosophila . Methods Mol. Biol. Vol. 420. pp. 45–59 . doi :10.1007/978-1-59745-583-1_3. ISBN978-1-58829-817-1. PMID 18641940.
^ База данных универсальных модельных организмов (GMOD).
^ «Главная страница». ФлайБейс . Проверено 24 апреля 2022 г.
^ Пит Гейгер (2002). "Введение в Drosophila Melanogaster". BIOLOGY.ARIZONA.EDU. Архивировано из оригинала 2 августа 2013 года.
^ Gelbart, WM; Crosby, M; Matthews, B; Rindone, WP; Chillemi, J; Russo Twombly, S; Emmert, D; Ashburner, M; Drysdale, RA; Whitfield, E; Millburn, GH; de Grey, A; Kaufman, T; Matthews, K; Gilbert, D; Strelets, V; Tolstoshev, C (1997). "FlyBase: база данных Drosophila. Консорциум FlyBase". Nucleic Acids Res . 25 (1): 63– 6. doi :10.1093/nar/25.1.63. PMC 146418. PMID 9045212 .
^ "FlyBase: О программе - Консорциум FlyBase" . Вики-сайт Flybase . Проверено 24 апреля 2022 г.
^ Драйсдейл, Рэйчел; Flybase Consortium (2008-07-19). "FlyBase: База данных для сообщества исследователей дрозофилы". В Dahmann, Christian (ред.). Drosophila . Методы в молекулярной биологии . Том 420. Тотова, Нью-Джерси, США: Humana Press. стр. 45–59 . doi :10.1007/978-1-59745-583-1_3. ISBN978-1-58829-817-1. PMID 18641940.
^ "Найти человека". Архивировано из оригинала 25 мая 2019 года.[ мертвая ссылка ]
^ "Cytosearch". Архивировано из оригинала 2011-10-07 . Получено 2011-11-24 .
^ Хантер, У. Б.; Данг, П. М.; Баушер, М. Г.; Чапарро, Дж. Х.; Маккендри, У.; Шаттерс, Р. Г.; Маккензи, К. Л.; Синистерра, К. Х. (2003). «Биология тли: экспрессированные гены крылатой Toxoptera citricida, коричневой цитрусовой тли». J. Insect Sci . 3 : 23. doi : 10.1093/jis/3.1.23. PMC 524662. PMID 15841239 .
^ "The Gene Ontology" . Получено 31 мая 2017 г. .
^ Tweedie, Susan; et al. (2009). "FlyBase: Enhancing Drosophila Gene Ontology Annotations". Nucleic Acids Research . 37 (выпуск базы данных). Oxford Journals: D555 – D559 . doi :10.1093/nar/gkn788. PMC 2686450. PMID 18948289 .