Биологические базы данных являются хранилищами биологической информации. [1] Журнал Nucleic Acids Research регулярно публикует специальные выпуски по биологическим базам данных и содержит список таких баз данных. В выпуске 2018 года содержится список из около 180 таких баз данных и обновлений ранее описанных баз данных. [2] Omics Discovery Index можно использовать для просмотра и поиска в нескольких биологических базах данных. Кроме того, портал NIAID Data Ecosystem Discovery Portal, разработанный Национальным институтом аллергии и инфекционных заболеваний (NIAID), позволяет осуществлять поиск по базам данных.
Мета-базы данных — это базы данных баз данных, которые собирают данные о данных для генерации новых данных. Они способны объединять информацию из разных источников и делать ее доступной в новой и более удобной форме или с акцентом на определенном заболевании или организме. Первоначально метаданные были только общим термином, относящимся просто к данным о данных, таким как теги, ключевые слова и заголовки разметки.
Базы данных модельных организмов предоставляют подробные биологические данные для интенсивно изучаемых организмов.
Первичные базы данных составляют Международную базу данных последовательностей нуклеотидов (INSD). Они включают:
DDBJ (Япония), GenBank (США) и European Nucleotide Archive (Европа) являются репозиториями данных о нуклеотидных последовательностях всех организмов . Все три принимают заявки на нуклеотидные последовательности, а затем ежедневно обмениваются новыми и обновленными данными для достижения оптимальной синхронизации между ними. Эти три базы данных являются основными, поскольку они содержат исходные данные о последовательностях. Они сотрудничают с Sequence Read Archive (SRA), который архивирует необработанные считывания с высокопроизводительных инструментов секвенирования.
Вторичные базы данных: [ требуется разъяснение ]
Другие базы данных
Базы данных экспрессии генов на микрочипах
Эти базы данных собирают последовательности генома , аннотируют и анализируют их, а также предоставляют публичный доступ. Некоторые добавляют кураторство экспериментальной литературы для улучшения вычисляемых аннотаций. Эти базы данных могут содержать геномы многих видов или геном одного модельного организма .
(См. также: Список белков в организме человека)
Несколько общедоступных репозиториев данных и ресурсов были разработаны для поддержки и управления информацией, связанной с белками , открытия биологических знаний и генерации гипотез на основе данных. [15] Базы данных в таблице ниже выбраны из баз данных, перечисленных в выпусках баз данных Nucleic Acids Research (NAR) и коллекции баз данных, а также баз данных, перекрестно ссылающихся в UniProt KB. Большинство этих баз данных перекрестно ссылаются на UniProt / UniProt KB, так что идентификаторы могут быть сопоставлены друг с другом. [15]
Белки человека:
В стандартном геноме человека насчитывается около ~20 000 генов, кодирующих белки. (Примерно о ~1200 уже есть статьи в Википедии - Gene Wiki - о них). Если мы включим варианты сплайсинга, то может быть около 500 000 уникальных человеческих белков [16]
Этот раздел нуждается в расширении . Вы можете помочь, дополнив его. ( Январь 2015 ) |
Имя БД | сайт БД | Провайдер | Источники данных | Источники доходов/спонсоров | Интегрирует | Уб. | Размер | Тип БД | Активно поддерживается |
---|---|---|---|---|---|---|---|---|---|
ИнтерПро | http://www.ebi.ac.uk/interpro/ | Инфраструктура ЭЛИКСИР | Европейский институт биоинформатики | EMBL , The Welcome Trust, BBSRC | CATH-Gene3D, CDD, HAMAP, MobiDB, PANTHER, Pfam, SMART, SUPERFAMILY, SFLD, TIGRFAMs, | классифицирует белки по семействам и предсказывает наличие доменов и участков | Базы данных белковых последовательностей | Да | |
СледующийProt | https://www.nextprot.org/ | CALIPHO (группа в SIB) | Швейцарский институт биоинформатики | https://www.sib.swiss/about/funding-sources | UniProt , Целлозавр, Гномад, IntAct, Атлас SRAA, Uniprot - GOA, BGEE, COSMIC, MassIVE, Пептидный атлас | ресурс знаний, посвященный человеческому белку | Базы данных белковых последовательностей | Да | |
Вики-пи | http://severus.dbmi.pitt.edu/wiki-pi/ | Мадхави К. Ганапатираджу | В настоящее время Wiki-Pi содержит 48 419 уникальных взаимодействий среди 10 492 белков. Однако не ясно, являются ли эти белки уникальными[13] | База данных взаимодействия белков | ?? | ||||
База данных справочных данных по белкам человека | Институт биоинформатики (IOB), Бангалор , Индия | Один источник утверждает, что существует 15000 [17] белков. Но неясно, сколько из них являются уникальными | |||||||
Пфам | Институт Сэнгера | база данных семейств белков с выравниваниями и HMM | Базы данных белковых последовательностей | ||||||
Человеческая протеинопедия | Институт биоинформатики (IOB), Бангалор и Университет Джонса Хопкинса , | Human Proteinpedia основана на HPRD (база данных справочных данных по белкам человека), которая является репозиторием, содержащим более 30 000 белков человека. Однако неясно, сколько из них являются уникальными белками. | |||||||
Атлас белков человека | Правительство Швеции | Он содержит около 10 миллионов изображений IHC чуть менее 25 000 антител. Но опять же неясно, сколько из них являются уникальными | |||||||
ОТПЕЧАТКИ | Манчестерский университет | сборник белковых отпечатков пальцев | Базы данных белковых последовательностей | ||||||
ПРОСИТ | база данных семейств и доменов белков | Базы данных белковых последовательностей | |||||||
Информационный ресурс о белках | Медицинский центр Джорджтаунского университета [GUMC] | Базы данных белковых последовательностей | |||||||
СУПЕРСЕМЬЯ | библиотека HMM, представляющих суперсемейства, и база данных аннотаций (суперсемейств и семейств) для всех полностью секвенированных организмов | Базы данных белковых последовательностей | |||||||
Swiss-Prot | Швейцарский институт биоинформатики | база знаний о белках | Базы данных белковых последовательностей | ||||||
Банк данных белков | ProteinDataBank в Европе (PDBe), [18] ProteinDatabank в Японии (PDBj), [19] Research Collaboratory for Structural Bioinformatics (RCSB) [20] | (ПДБ) | Базы данных структур белков | ||||||
Структурная классификация белков (SCOP) | Базы данных структур белков | ||||||||
База данных CATH | Базы данных структур белков | ||||||||
ModBase | Лаборатория Сали , Калифорнийский университет в Сан-Франциско | база данных сравнительных моделей структуры белков | Базы данных моделей белков | ||||||
СИМАП | база данных сходств белков, рассчитанная с помощью FASTA | Базы данных моделей белков | |||||||
Швейцарская модель | сервер и репозиторий моделей структуры белков | Базы данных моделей белков | |||||||
AAindex | база данных аминокислотных индексов, матриц мутаций аминокислот и парных контактных потенциалов | Базы данных моделей белков | |||||||
БиоГРИД | Научно-исследовательский институт Самуэля Люненфельда | общий репозиторий для наборов данных взаимодействия | Белок-белковые и другие молекулярные взаимодействия | ||||||
База данных РНК-связывающих белков | Белок-белковые и другие молекулярные взаимодействия | ||||||||
База данных взаимодействующих белков | Калифорнийский университет | Белок-белковые и другие молекулярные взаимодействия | |||||||
ИнтАкт [21] | EMBL-EBI | база данных с открытым исходным кодом для молекулярных взаимодействий | Белок-белковые и другие молекулярные взаимодействия | ||||||
Нить | открытая база данных молекулярных взаимодействий для изучения взаимодействий между белками | Белок-белковые и другие молекулярные взаимодействия | |||||||
Атлас белков человека | Атлас белков человека | направлен на картирование всех человеческих белков в клетках, тканях и органах | Базы данных экспрессии белков | ||||||
ProteinModelPortal | Портал белковых моделей базы знаний структурной биологии PSI-Nature | ?? | ?? | Базы данных 3D-структур белков | |||||
Репозиторий SWISS-MODEL | База данных аннотированных 3D-моделей структур белков | Базельский университет | Швейцарское правительство | Базы данных 3D-структур белков | |||||
DisProt | База данных белковых расстройств | Инфраструктура ЭЛИКСИР | Медицинская школа Университета Индианы , Университет Темпл , Университет Падуи | финансирование из программы Европейского Союза «Горизонт 2020» | Swiss Prot/Uni Prot, CATH, Pfam, Europe PMC, BITEM, ECO, Генеонтология | база данных экспериментальных доказательств беспорядка в белках | Базы данных 3D-структур белков, Базы данных последовательностей белков | ||
МобиДБ | База данных внутренне неупорядоченных и мобильных белков | Джон Моулт, Кристин Оренго, Предраг Радивояк | Университет Падуи | Правительство Италии | база данных аннотаций внутренних нарушений белков | Базы данных 3D-структур белков, Базы данных последовательностей белков | |||
ModBase | База данных сравнительных моделей структуры белков | Урсула Пипер, Бен Уэбб, Нарайанан Эсвар, Андрей Сали, Роберто Санчес | Калифорнийский университет в Сан-Франциско, лаборатория Сали | Базы данных 3D-структур белков | |||||
PDBsum | База данных изображений 3D-структур в Protein Data Bank | Европейский институт биоинформатики 2013 | Добро пожаловать, доверие | Базы данных 3D-структур белков | |||||
CCDS | База данных набора белков Consensus CDS | NCBI | ?? | Базы данных последовательностей | |||||
UniProtKB | Универсальный белковый ресурс (UniProt) | ?? | ?? | Базы данных последовательностей | |||||
Швейцарский Прот/Университетский Прот | https://www.sib.swiss/swiss-prot и https://www.uniprot.org/ | SIB Швейцарский институт биоинформатики | Европейский институт биоинформатики (EMBL-EBI) | Swiss-Prot собрал более 81 000 вариантов в примерно 13 000 записей последовательностей человеческих белков из рецензируемой литературы. Неясно, сколько уникальных типов белков присутствует в базе данных. |
Многочисленные базы данных собирают информацию о видах и других таксономических категориях. Каталог жизни — это особый случай, поскольку это метабаза данных из примерно 150 специализированных «глобальных баз данных видов» (GSD), которые собрали названия и другую информацию о (почти) всех описанных и, таким образом, «известных» видах.
Изображения играют важную роль в биомедицине, начиная от изображений антропологических образцов и заканчивая зоологией . Однако существует относительно немного баз данных, посвященных сбору изображений, хотя некоторые проекты, такие как iNaturalist, собирают фотографии как основную часть своих данных. Особым случаем «изображений» являются трехмерные изображения, такие как белковые структуры или трехмерные реконструкции анатомических структур. Базы данных изображений включают, среди прочего: [22]