Данные FAIR — это данные , которые соответствуют принципам FAIR по находимости , доступности, совместимости и возможности повторного использования (FAIR). [1] [2] Аббревиатура и принципы были определены в статье, опубликованной в журнале Scientific Data в марте 2016 года консорциумом ученых и организаций. [1]
Принципы FAIR подчеркивают машинную применимость (т. е. способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без какого-либо или с минимальным вмешательством человека), поскольку люди все больше полагаются на вычислительную поддержку для работы с данными в результате увеличения объема, сложности и скорости производства данных. [3]
Аббревиатура FAIR/O data иногда используется для указания того, что рассматриваемый набор данных или база данных соответствует принципам FAIR, а также имеет явную открытую лицензию , допускающую работу с данными .
Находимый
Первый шаг в (повторном) использовании данных — их поиск. Метаданные и данные должны быть легкодоступны как для людей, так и для компьютеров. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, поэтому это важный компонент процесса FAIRification.
F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор.
F2. Данные описываются с помощью расширенных метаданных (определенных R1 ниже)
F3. Метаданные четко и явно включают идентификатор данных, которые они описывают.
F4. (Мета)данные регистрируются или индексируются в поисковом ресурсе
Доступный
Как только пользователь найдет необходимые данные, ему необходимо знать, как к ним можно получить доступ, возможно, включая аутентификацию и авторизацию .
A1. (Мета)данные могут быть извлечены по их идентификатору с использованием стандартизированного протокола связи.
A1.1 Протокол является открытым, бесплатным и универсально реализуемым.
A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо.
A2. Метаданные доступны, даже если данные больше не доступны.
Совместимый
Данные обычно должны быть интегрированы с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа , хранения и обработки .
I1. (Мета)данные используют формальный, доступный, общий и широко применимый язык для представления знаний.
I2. (Мета)данные используют словари , которые следуют принципам FAIR
I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные.
Многоразовый
Конечной целью FAIR является оптимизация повторного использования данных. Для этого метаданные и данные должны быть хорошо описаны, чтобы их можно было реплицировать и/или комбинировать в различных условиях.
R1. (Мета)данные подробно описаны с множеством точных и релевантных атрибутов.
R1.1. (Мета)данные выпускаются с четкой и доступной лицензией на использование данных.
R1.2. (Мета)данные связаны с подробным происхождением
R1.3. (Мета)данные соответствуют стандартам сообщества, соответствующим предметной области
Принципы относятся к трем типам сущностей: данные (или любой цифровой объект), метаданные (информация об этом цифровом объекте) и инфраструктура. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в доступном для поиска ресурсе (компонент инфраструктуры).
— Фонд GO FAIR, Принципы FAIR, https://www.gofair.foundation/
До FAIR самой ранней работой, в которой обсуждались схожие идеи, связанные с доступностью данных, была статья 2007 года. [4]
На саммите G20 в Ханчжоу в 2016 году лидеры G20 выступили с заявлением, в котором одобрили применение принципов FAIR к исследованиям. [5] [6] Также в 2016 году группа австралийских организаций разработала Заявление о доступе FAIR к результатам австралийских исследований, целью которого было распространение принципов на результаты исследований в более общем плане. [7] В 2017 году Германия, Нидерланды и Франция договорились о создании [8] международного офиса для поддержки инициативы FAIR — Международного офиса поддержки и координации GO FAIR. [9]
Другие международные организации, работающие в экосистеме исследовательских данных, такие как CODATA или Research Data Alliance (RDA), также поддерживают внедрение FAIR их сообществами. Оценка внедрения принципов FAIR изучается рабочей группой FAIR Data Maturity Model Working Group RDA, [10] Стратегическая десятилетняя программа CODATA «Данные для планеты: как заставить данные работать на междоменные проблемы» [11] упоминает принципы данных FAIR как фундаментальный фактор, способствующий развитию науки, основанной на данных. Ассоциация европейских исследовательских библиотек рекомендует использовать принципы FAIR. [12]
В статье 2017 года сторонников данных FAIR сообщается, что осведомленность о концепции FAIR растет среди различных исследователей и институтов, но также понимание концепции становится запутанным, поскольку разные люди применяют к ней свои собственные различные точки зрения. [13]
В руководствах по внедрению методов работы с данными FAIR указано, что стоимость плана управления данными в соответствии с методами работы с данными FAIR должна составлять 5% от общего бюджета исследований. [14]
В 2019 году Глобальный альянс по данным коренных народов (GIDA) выпустил Принципы CARE для управления данными коренных народов в качестве дополнительного руководства. [15] Принципы CARE расширяют принципы, изложенные в данных FAIR, включая коллективную выгоду, полномочия по контролю, ответственность и этику, чтобы гарантировать, что руководящие принципы по данным учитывают исторические контексты и различия в силе. Принципы CARE для управления данными коренных народов были разработаны на совместном мероприятии Международной недели данных и пленарного заседания Альянса по данным исследований «Принципы суверенитета данных коренных народов для семинара по управлению данными коренных народов», состоявшемся 8 ноября 2018 года в Габороне , Ботсвана. [16]
Отсутствие информации о том, как применять руководящие принципы, привело к их непоследовательному толкованию. [17]
В январе 2020 года представители девяти групп университетов по всему миру подготовили Сорбонскую декларацию о правах на исследовательские данные , [18] которая включала обязательство по данным FAIR и призвала правительства оказать поддержку для ее реализации. [19] В 2021 году исследователи определили принципы FAIR как концептуальный компонент программных инструментов каталога данных, а другими компонентами являются управление метаданными, бизнес-контекст и роли ответственности за данные. [20] В апреле 2022 года Маттиас Шеффлер и его коллеги утверждали в Nature , что принципы FAIR являются «обязательными», чтобы интеллектуальный анализ данных и искусственный интеллект могли извлекать полезную научную информацию из данных. [21]
Однако сделать данные (и результаты исследований) СПРАВЕДЛИВЫМИ — сложная задача, и оценить СПРАВЕДЛИВОСТЬ тоже непросто. [22]
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка )