Консорциум по геномным стандартам (GSC) — это инициатива, направленная на более полное описание нашей коллекции геномов, метагеномов и маркерных генов. Созданное в сентябре 2005 года, [1] это международное сообщество включает представителей ряда крупных центров секвенирования и биоинформатики (включая NCBI , EMBL , DDBJ , JCVI , JGI , EBI , Sanger , FIG) и научно-исследовательских институтов. Целью GSC является продвижение механизмов стандартизации описания (мета)геномов, включая обмен и интеграцию (мета)геномных данных. Количество и темпы проектов по геномному и метагеномному секвенированию будут только увеличиваться по мере того, как использование методов сверхвысокой пропускной способности станет обычным явлением, а стандарты станут жизненно важными для научного прогресса и обмена данными .
Стандарты, разработанные сообществом, имеют наилучшие шансы на успех, если они разрабатываются под эгидой международных рабочих групп. Участниками GSC являются биологи, специалисты по информатике, те, кто создает геномные базы данных и проводит крупномасштабные сравнительные геномные анализы, а также те, кто имеет опыт создания стандартов, разработанных сообществом. Миссия GSC заключается в работе с более широким сообществом в направлении:
Выполнение этой миссии путем проведения личных встреч, формирования рабочих групп и создания консенсусных продуктов, которые могут быть широко использованы в этом сообществе. Объединение исследователей, работающих в разных системах, для работы над общей проблемой. [2]
GSC опубликовал спецификацию «Минимальная информация о последовательности (мета)генома» и теперь завершил спецификацию «Минимальная информация о последовательности окружающей среды». MIGS/MIMS/MIMARKS предоставляет расширение минимальной информации, уже собранной первичными архивами нуклеотидных последовательностей (INSDC или DDBJ/ENA/GenBank). Разработка любого контрольного списка должна быть открытым и итеративным процессом, в котором участвует сбалансированная группа участников. Кроме того, этот процесс разработки должен поддерживаться предоставлением механизмов для достижения соответствия, если контрольный список должен быть принят в качестве инструмента для стандартизации определенной области знаний. Работа по достижению этой цели породила ряд взаимосвязанных проектов, которые более подробно описаны здесь: проекты GSC. К ним относятся язык разметки геномных контекстных данных (GCDML), геномный розеттский камень (GRS), Habitat-Lite. Более новые проекты включают проект M5.
GSC заинтересован в создании и построении связей с другими сообществами. Как указано выше, GSC занимается разработкой онтологии в рамках OBO Foundry. GSC также является одним из основателей сообщества Minimum Information about a Biomedical or Biological Investigation (MIBBI), зонтичного сообщества для поддержки и координации разработки контрольных списков, описывающих Минимальные стандарты информации .
GSC и проект «Микробиом Земли» поддерживают формат файла матрицы биологических наблюдений (BIOM), открытый формат файла на основе JSON для представления произвольных наблюдений с помощью таблиц сопряженности образцов с соответствующими метаданными образцов и наблюдений. [3]
GSC ведет список публикаций на своей вики - GSC Publications. Этот список включает отчеты со всех семинаров, статьи из специального выпуска журнала OMICS по стандартам данных и публикации, описывающие спецификации MIGS/MIMS и MIMARKS в журнале Nature Biotechnology (май 2008 и май 2011 соответственно). GSC также опубликовал серию статей "Genomic Standards Consortium and Beyond" в журнале GigaScience . [4] [2]