СПРАВЕДЛИВЫЕ данные

Данные, соответствующие условиям Принципов данных FAIR
Введение в данные FAIR и постоянные идентификаторы .

Данные FAIR — это данные , которые соответствуют принципам FAIR по находимости , доступности, совместимости и возможности повторного использования (FAIR). [1] [2] Аббревиатура и принципы были определены в статье, опубликованной в журнале Scientific Data в марте 2016 года консорциумом ученых и организаций. [1]

Принципы FAIR подчеркивают машинную применимость (т. е. способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без какого-либо или с минимальным вмешательством человека), поскольку люди все больше полагаются на вычислительную поддержку для работы с данными в результате увеличения объема, сложности и скорости производства данных. [3]

Аббревиатура FAIR/O data иногда используется для указания того, что рассматриваемый набор данных или база данных соответствует принципам FAIR, а также имеет явную открытую лицензию , допускающую работу с данными .

Принципы FAIR, опубликованные GO FAIR

Находимый

Первый шаг в (повторном) использовании данных — их поиск. Метаданные и данные должны быть легкодоступны как для людей, так и для компьютеров. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, поэтому это важный компонент процесса FAIRification.

F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор.

F2. Данные описываются с помощью расширенных метаданных (определенных R1 ниже)

F3. Метаданные четко и явно включают идентификатор данных, которые они описывают.

F4. (Мета)данные регистрируются или индексируются в поисковом ресурсе

Доступный

Как только пользователь найдет необходимые данные, ему необходимо знать, как к ним можно получить доступ, возможно, включая аутентификацию и авторизацию .

A1. (Мета)данные могут быть извлечены по их идентификатору с использованием стандартизированного протокола связи.

A1.1 Протокол является открытым, бесплатным и универсально реализуемым.

A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо.

A2. Метаданные доступны, даже если данные больше не доступны.

Совместимый

Данные обычно должны быть интегрированы с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа , хранения и обработки .

I1. (Мета)данные используют формальный, доступный, общий и широко применимый язык для представления знаний.

I2. (Мета)данные используют словари , которые следуют принципам FAIR

I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные.

Многоразовый

Конечной целью FAIR является оптимизация повторного использования данных. Для этого метаданные и данные должны быть хорошо описаны, чтобы их можно было реплицировать и/или комбинировать в различных условиях.

R1. (Мета)данные подробно описаны с множеством точных и релевантных атрибутов.

R1.1. (Мета)данные выпускаются с четкой и доступной лицензией на использование данных.

R1.2. (Мета)данные связаны с подробным происхождением

R1.3. (Мета)данные соответствуют стандартам сообщества, соответствующим предметной области

Принципы относятся к трем типам сущностей: данные (или любой цифровой объект), метаданные (информация об этом цифровом объекте) и инфраструктура. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в доступном для поиска ресурсе (компонент инфраструктуры).

—  Фонд GO FAIR, Принципы FAIR, https://www.gofair.foundation/

Принятие и реализация

До FAIR самой ранней работой, в которой обсуждались схожие идеи, связанные с доступностью данных, была статья 2007 года. [4]

На саммите G20 в Ханчжоу в 2016 году лидеры G20 выступили с заявлением, в котором одобрили применение принципов FAIR к исследованиям. [5] [6] Также в 2016 году группа австралийских организаций разработала Заявление о доступе FAIR к результатам австралийских исследований, целью которого было распространение принципов на результаты исследований в более общем плане. [7] В 2017 году Германия, Нидерланды и Франция договорились о создании [8] международного офиса для поддержки инициативы FAIR — Международного офиса поддержки и координации GO FAIR. [9]

«Внедрение принципов FAIR Data – Роль библиотек», руководство

Другие международные организации, работающие в экосистеме исследовательских данных, такие как CODATA или Research Data Alliance (RDA), также поддерживают внедрение FAIR их сообществами. Оценка внедрения принципов FAIR изучается рабочей группой FAIR Data Maturity Model Working Group RDA, [10] Стратегическая десятилетняя программа CODATA «Данные для планеты: как заставить данные работать на междоменные проблемы» [11] упоминает принципы данных FAIR как фундаментальный фактор, способствующий развитию науки, основанной на данных. Ассоциация европейских исследовательских библиотек рекомендует использовать принципы FAIR. [12]

В статье 2017 года сторонников данных FAIR сообщается, что осведомленность о концепции FAIR растет среди различных исследователей и институтов, но также понимание концепции становится запутанным, поскольку разные люди применяют к ней свои собственные различные точки зрения. [13]

В руководствах по внедрению методов работы с данными FAIR указано, что стоимость плана управления данными в соответствии с методами работы с данными FAIR должна составлять 5% от общего бюджета исследований. [14]

В 2019 году Глобальный альянс по данным коренных народов (GIDA) выпустил Принципы CARE для управления данными коренных народов в качестве дополнительного руководства. [15] Принципы CARE расширяют принципы, изложенные в данных FAIR, включая коллективную выгоду, полномочия по контролю, ответственность и этику, чтобы гарантировать, что руководящие принципы по данным учитывают исторические контексты и различия в силе. Принципы CARE для управления данными коренных народов были разработаны на совместном мероприятии Международной недели данных и пленарного заседания Альянса по данным исследований «Принципы суверенитета данных коренных народов для семинара по управлению данными коренных народов», состоявшемся 8 ноября 2018 года в Габороне , Ботсвана. [16]

Отсутствие информации о том, как применять руководящие принципы, привело к их непоследовательному толкованию. [17]

В январе 2020 года представители девяти групп университетов по всему миру подготовили Сорбонскую декларацию о правах на исследовательские данные , [18] которая включала обязательство по данным FAIR и призвала правительства оказать поддержку для ее реализации. [19] В 2021 году исследователи определили принципы FAIR как концептуальный компонент программных инструментов каталога данных, а другими компонентами являются управление метаданными, бизнес-контекст и роли ответственности за данные. [20] В апреле 2022 года Маттиас Шеффлер и его коллеги утверждали в Nature , что принципы FAIR являются «обязательными», чтобы интеллектуальный анализ данных и искусственный интеллект могли извлекать полезную научную информацию из данных. [21]

Однако сделать данные (и результаты исследований) СПРАВЕДЛИВЫМИ — сложная задача, и оценить СПРАВЕДЛИВОСТЬ тоже непросто. [22]

Смотрите также

Ссылки

  1. ^ ab Mark D. Wilkinson; Michel Dumontier ; IJsbrand Jan Aalbersberg; et al. (15 марта 2016 г.). «Руководящие принципы FAIR для управления и обеспечения научными данными». Scientific Data . 3 (1): 160018. doi :10.1038/SDATA.2016.18. ISSN  2052-4463. PMC 4792175.  PMID 26978244.  Wikidata Q27942822  .
  2. ^ Анника Якобсен; Рикардо де Миранда Азеведо; Ник Джути; и др. (31 января 2020 г.). «Принципы FAIR: интерпретации и вопросы внедрения». Data Intelligence . 2 ( 1– 2): 10– 29. doi :10.1162/DINT_R_00024. ISSN  2641-435X. Wikidata  Q76394974.
  3. ^ "СПРАВЕДЛИВЫЕ ПРИНЦИПЫ". GO FAIR . Получено 2020-02-16 . Материал скопирован из этого источника, который доступен по лицензии Creative Commons Attribution 4.0 International.
  4. ^ Сандра Коллинз; Франсуаза Дженова; Натали Харроуэр; Саймон Ходсон; Сара Джонс; Лейф Лааксонен; Дэниел Митчен; Рута Петраускайте; Питер Виттенбург (7 июня 2018 г.), «Превращение данных FAIR в реальность: промежуточный отчет группы экспертов Европейской комиссии по данным FAIR», Zenodo, doi : 10.5281/ZENODO.1285272
  5. ^ Лидеры G20 (5 сентября 2016 г.). «Коммюнике лидеров G20 по итогам саммита в Ханчжоу». europa.eu . Европейская комиссия.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  6. ^ "Европейская комиссия принимает принципы FAIR – Голландский технический центр по наукам о жизни". Голландский технический центр по наукам о жизни . 20 апреля 2016 г.
  7. ^ "Австралийская рабочая группа FAIR Access". www.fair-access.net.au . Получено 2020-04-03 .
  8. ^ Министерство ван Ондервейса, Cultuur en Wetenschap (01 декабря 2017 г.). «Прогресс на пути к Европейскому облаку открытой науки – GO FAIR – Новостной сюжет – Government.nl». www.government.nl (на голландском языке) . Проверено 15 февраля 2020 г.
  9. ^ "GO FAIR Offices". GO FAIR . Получено 2023-12-05 .
  10. ^ "FAIR Data Maturity Model WG". RDA . 2018-09-23 . Получено 2020-02-16 .
  11. ^ "Decadal Programme – CODATA". www.codata.org . Получено 2020-02-16 .
  12. ^ Ассоциация европейских исследовательских библиотек (13 июля 2018 г.). «Открытая консультация по плану действий FAIR Data – LIBER». LIBER .
  13. ^ Баренд Монс ; Кэмерон Нейлон ; Ян Вельтероп ; Мишель Дюмонтье ; Луис Олаво Бонино да Силва Сантос; Марк Д. Уилкинсон (7 марта 2017 г.). «Облачно, все более FAIR; пересмотр принципов FAIR Data guiding principles для European Open Science Cloud». Information Services & Use . 37 (1): 49– 56. doi :10.3233/ISU-170824. ISSN  0167-5265. Wikidata  Q29051495.
  14. ^ Science Europe (май 2016 г.). «Финансирование управления исследовательскими данными и связанными с ними инфраструктурами» (PDF) .
  15. ^ "Принципы CARE по управлению данными коренных народов". Глобальный альянс по данным коренных народов . Получено 30 сентября 2019 г.
  16. ^ О'Доннелл, Дэн (16.12.2021). «Размышления о принципах CARE в цифровых гуманитарных науках». DARIAH-Campus .
  17. ^ Анника Якобсен; Рикардо де Миранда Азеведо; Ник Джути; и др. (31 января 2020 г.). «Принципы FAIR: интерпретации и вопросы внедрения». Data Intelligence . 2 ( 1– 2): 10– 29. doi :10.1162/DINT_R_00024. ISSN  2641-435X. Wikidata  Q76394974.
  18. ^ Сорбоннская декларация о правах на исследовательские данные, 27 января 2020 г.
  19. ^ Открытые данные «жестче», чем открытый доступ, и требуют «изменения мышления», Times Higher Education , 31 января 2020 г.
  20. ^ Эрлингер, Лиза; Шротт, Йоханнес; Мелихар, Мартин; Кирхмайер, Николас; Вёсс, Вольфрам (2021), Котсис, Габриэле; Тьоа, А. Мин; Халил, Исмаил; Мозер, Бернхард (ред.), «Каталоги данных: систематический обзор литературы и рекомендации по внедрению», Приложения для баз данных и экспертных систем — семинары DEXA 2021 , Коммуникации в области компьютерных и информационных наук, т. 1479, Cham: Springer International Publishing, стр.  148–158 , doi : 10.1007/978-3-030-87101-7_15, ISBN 978-3-030-87100-0, S2CID  237621026 , получено 2022-06-26
  21. ^ Шеффлер, Матиас; Эшлиманн, Мартин; Альбрехт, Мартин; Беро, Тристан; Бунгартц, Ханс-Иоахим; Фельзер, Клаудия; Грейнер, Марк; Гросс, Аксель; Кох, Кристоф Т.; Кремер, Курт; Нагель, Вольфганг Э. (28 апреля 2022 г.). «Данные FAIR открывают новые горизонты для исследования материалов». Природа . 604 (7907): 635–642 . arXiv : 2204.13240 . Бибкод : 2022Natur.604..635S. дои : 10.1038/s41586-022-04501-x. ISSN  0028-0836. PMID  35478233. S2CID  248415511.
  22. ^ Кандела, Леонардо; Манджоне, Дарио; Павоне, Джина (27.05.2024). «Загадка оценки FAIR: размышления об инструментах и ​​метриках». Data Science Journal . 23 : 33. doi : 10.5334/dsj-2024-033 .
  • FAIR Data and Semantic Publishing, заявление лаборатории первого автора оригинальной статьи
  • Руководство по данным FAIR от Голландского технического центра по биологическим наукам
  • Веб-сайт инициативы GO FAIR
  • Принципы FAIR с подробным описанием каждого из руководящих принципов инициативы GO FAIR
  • Сказка, объясняющая принципы FAIR, опубликованная проектом FAIR
Получено с "https://en.wikipedia.org/w/index.php?title=FAIR_data&oldid=1243126526"