Международная коллаборация по базам данных последовательностей нуклеотидов ( INSDC ) представляет собой совместную работу по сбору и распространению баз данных, содержащих последовательности ДНК и РНК . [1] Она включает в себя следующие компьютеризированные базы данных : Банк данных ДНК Японии ( Япония ) NIG , GenBank NCBI ( США ) и Европейский архив нуклеотидов ( EMBL ) EMBL - EBI . Новые и обновленные данные о последовательностях нуклеотидов , предоставленные исследовательскими группами в каждую из трех баз данных, синхронизируются ежедневно посредством постоянного взаимодействия между сотрудниками каждой из сотрудничающих организаций.
Все данные в INSDC доступны для свободного и неограниченного доступа, для любых целей, без ограничений на анализ, распространение или повторную публикацию данных. Эта политика является основополагающим принципом INSDC с момента его создания. [2] С 1990-х годов большинство крупнейших мировых научных журналов требуют, чтобы данные о последовательностях были размещены в базе данных INSDC в качестве предварительного условия для публикации.
Синхронизация DDBJ / EMBL -EBI / GenBank поддерживается в соответствии с рядом руководящих принципов, которые разрабатываются и публикуются Международным консультативным советом. [3] Руководящие принципы состоят из общего определения таблиц характеристик [4] для баз данных, которые регулируют содержание и синтаксис записей базы данных, [5] в форме общего DTD ( определение типа документа ).
Синтаксис называется INSDSeq, и его ядро состоит из последовательности букв генной экспрессии ( аминокислотной последовательности) и последовательности букв для нуклеотидных оснований в гене или декодированном сегменте. В операции DBFetch показана типичная запись INSD в базе данных EMBL-EBI; [6] та же запись в NCBI. [7]