Протокол Open Archives Initiative для сбора метаданных ( OAI-PMH ) — это протокол, разработанный для сбора описаний метаданных записей в архиве, чтобы можно было создавать сервисы с использованием метаданных из многих архивов. Реализация OAI-PMH должна поддерживать представление метаданных в Dublin Core , но может также поддерживать дополнительные представления. [1] [2]
Протокол обычно называют просто протоколом OAI.
OAI-PMH использует XML через HTTP . Версия 2.0 протокола была выпущена в 2002 году; последний раз документ обновлялся в 2015 году. Имеет лицензию Creative Commons BY-SA.
В конце 1990-х годов Герберт Ван де Сомпель ( Гентский университет ) работал с исследователями и библиотекарями в Лос-Аламосской национальной лаборатории (США) и созвал совещание для рассмотрения трудностей, связанных с проблемами взаимодействия серверов электронной печати и цифровых репозиториев . Совещание состоялось в Санта-Фе, штат Нью-Мексико , в октябре 1999 года. [3] Ключевым достижением совещания стало определение интерфейса, который позволял серверам электронной печати выставлять метаданные для хранящихся на них документов в структурированном виде, чтобы другие репозитории могли идентифицировать и копировать друг другу интересующие документы. Этот интерфейс/протокол был назван «Конвенцией Санта-Фе». [1] [2] [4]
Несколько семинаров были проведены в 2000 году на конференции ACM Digital Libraries [5] , на 1-й совместной конференции ACM/IEEE-CS по цифровым библиотекам [6] [7] и в других местах для обмена идеями с конвенции Санта-Фе. [8] На семинарах было обнаружено, что проблемы, с которыми сталкивается сообщество электронной печати, также являются общими для библиотек, музеев, издателей журналов и других, которым необходимо совместное использование распределенных ресурсов. Для решения этих потребностей Коалиция за сетевую информацию [9] и Федерация цифровых библиотек [10] предоставили финансирование для создания секретариата Инициативы открытых архивов (OAI), которым руководили Герберт Ван де Сомпель и Карл Лагозе. OAI провела встречу в Корнеллском университете ( Итака, Нью-Йорк ) в сентябре 2000 года, направленную на улучшение интерфейса, разработанного на конвенции Санта-Фе. [11] Спецификации были уточнены по электронной почте.
Версия OAI-PMH 1.0 была представлена общественности в январе 2001 года на семинаре в Вашингтоне, округ Колумбия , [12] и еще один в феврале в Берлине, Германия . [13] Последующие изменения стандарта XML , внесенные W3C, потребовали внесения незначительных изменений в OAI-PMH, что привело к версии 1.1. Текущая версия, 2.0, была выпущена в июне 2002 года. Она содержала несколько технических изменений и усовершенствований и не является обратно совместимой. [14]
С 2001 года ЦЕРН , а позднее в сотрудничестве с Женевским университетом , организовала два раза в год семинары OAI, [15] которые со временем развились и охватили большинство аспектов открытой науки . С 2021 года серия семинаров называется Женевский семинар по инновациям в научной коммуникации, а псевдоним OAI отражает его происхождение. [16]
Некоторые коммерческие поисковые системы используют OAI-PMH для получения дополнительных ресурсов. Google изначально включил поддержку OAI-PMH при запуске Sitemaps, однако в мае 2008 года решил поддерживать только стандартный формат XML Sitemaps . [17] В 2004 году Yahoo! приобрел контент у OAIster ( Мичиганский университет ), который был получен путем сбора метаданных с помощью OAI-PMH. Wikimedia использует репозиторий OAI-PMH для предоставления каналов Wikipedia и связанных обновлений сайта для поисковых систем и других усилий по массовому анализу/переизданию. [18] Особенно при работе с тысячами файлов, собираемых каждый день, OAI-PMH может помочь в сокращении сетевого трафика и другого использования ресурсов за счет выполнения инкрементного сбора. [19] Поисковая система метаданных NASA Mercury использует OAI-PMH для индексации тысяч записей метаданных из Global Change Master Directory (GCMD) каждый день. [20]
Проект mod_oai использует OAI-PMH для предоставления веб-сканерам контента, доступного с веб-серверов Apache .
Позднее OAI-PMH был применен для обмена научными данными. [21]
OAI-PMH основан на архитектуре клиент-сервер , в которой «сборщики» запрашивают информацию об обновленных записях из «репозиториев». Запросы данных могут быть основаны на диапазоне дат и могут быть ограничены именованными наборами, определенными поставщиком. Поставщики данных обязаны предоставлять XML- метаданные в формате Dublin Core , а также могут предоставлять их в других форматах XML.
Ряд программных систем поддерживают OAI-PMH, включая Fedora , EThOS из Британской библиотеки , GNU EPrints из Университета Саутгемптона , Open Journal Systems из Public Knowledge Project , Desire2Learn , DSpace из MIT , HyperJournal из Университета Пизы , Digibib из Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta и MetaLib из Ex Libris , ArchivalWare из PTFS, DOOR [22] из eLab [23] в Лугано, Швейцария, panFMP из библиотеки данных PANGAEA [24], SimpleDL из Roaring Development и jOAI из Национального центра атмосферных исследований [25] .
Протокол поддерживают ряд крупных архивов, включая arXiv и CERN Document Server.
{{cite journal}}
: CS1 maint: дата и год ( ссылка ){{cite book}}
: CS1 maint: дата и год ( ссылка ){{cite book}}
: CS1 maint: дата и год ( ссылка )