Использование внешних ссылок в этой статье может не соответствовать политике или рекомендациям Википедии . ( Август 2020 ) |
Стандарт реестра метаданных (MDR) ISO /IEC 11179 — это международный стандарт ISO / IEC для представления метаданных для организации в реестре метаданных. Он документирует стандартизацию и регистрацию метаданных, чтобы сделать данные понятными и доступными для совместного использования. [1]
Модель ISO/IEC 11179 является результатом двух принципов семантической теории в сочетании с базовыми принципами моделирования данных.
Первый принцип семантической теории — это связь тезаурусного типа между более широкими и более узкими (или конкретными) понятиями, например, широкое понятие «доход» имеет связь с более узким понятием «чистый доход».
Вторым принципом семантической теории является связь между понятием и его представлением, например, «купить» и «приобрести» — это одно и то же понятие, хотя используются разные термины.
Базовым принципом моделирования данных является объединение класса объекта и характеристики. Например, «Человек — цвет волос».
Применительно к моделированию данных ISO/IEC 11179 объединяет широкое «понятие» с «классом объектов» для формирования более конкретного «понятия элемента данных». Например, высокоуровневое понятие «доход» объединяется с классом объектов «лицо» для формирования понятия элемента данных «чистый доход лица». Обратите внимание, что «чистый доход» более конкретен, чем «доход».
Различные возможные представления концепции элемента данных затем описываются с использованием одного или нескольких элементов данных. Различия в представлении могут быть результатом использования синонимов или различных доменов значений в различных наборах данных в хранилище данных. Домен значений — это разрешенный диапазон значений для характеристики класса объектов. Примером домена значений для «пола человека» является «M = мужской, F = женский, U = неизвестный». Буквы M, F и U затем являются разрешенными значениями пола человека в определенном наборе данных.
Таким образом, концепция элемента данных «ежемесячный чистый доход лица» может иметь один элемент данных под названием «ежемесячный чистый доход лица по 100-долларовым группировкам» и один под названием «ежемесячный чистый доход лица в диапазоне 0-1000 долларов» и т. д., в зависимости от неоднородности представления, существующей в пределах данных, охватываемых одним реестром ISO/IEC 11179. Обратите внимание, что в этих двух примерах используются разные термины для класса объектов (лицо/индивидуум) и разные наборы значений (диапазон 0-1000 долларов в отличие от 100-долларовых группировок).
Результатом этого является своего рода каталог, в котором связанные концепции элементов данных сгруппированы по концепции высокого уровня и классу объектов, а элементы данных сгруппированы по общей концепции элемента данных. Строго говоря, это не иерархия, даже если она на нее похожа.
ISO/IEC 11179 не описывает данные в том виде, в котором они фактически хранятся. Он не относится к описанию физических файлов, таблиц и столбцов. Конструкции ISO/IEC 11179 являются «семантическими» в отличие от «физических» или «технических».
Стандарт имеет две основные цели: определение и обмен. Основным объектом является концепция элемента данных, поскольку он определяет концепцию и, в идеале, описывает данные независимо от их представления в какой-либо одной системе, таблице, столбце или организации.
Стандарт состоит из семи частей:
Часть 1 объясняет назначение каждой части. Часть 3 определяет метамодель, которая определяет реестр. Часть 7 выпущена в декабре 2019 года и представляет собой расширение части 3 для регистрации метаданных о наборах данных. Другие части определяют различные аспекты использования реестра.
Элемент данных является основополагающей концепцией в реестре метаданных ISO/IEC 11179. Целью реестра является поддержание семантически точной структуры элементов данных.
Каждый элемент данных в реестре метаданных ISO/IEC 11179:
Элементы данных, хранящие «коды» или перечисляемые значения, также должны указывать семантику каждого из значений кода с точными определениями.
Продукт COTS Metadata Registry (MDR) компании Software AG поддерживает стандарт ISO 11179 и продолжает продаваться и использоваться для этой цели как в коммерческих, так и в государственных приложениях (см. раздел «Инструменты поставщика» ниже).
В то время как коммерческое внедрение растет, распространение ISO/IEC 11179 было более успешным в государственном секторе. Однако причина этого неясна. Членство в ISO открыто для организаций через их национальные органы. Страны с репозиториями государственного сектора в различных отраслях включают Австралию, Канаду, Германию, США и Великобританию.
Организация Объединенных Наций и правительство США ссылаются на стандарты 11179 и используют их. Стандарт 11179 настоятельно рекомендуется на веб-сайте XML правительства США [2] и продвигается The Open Group в качестве основы Universal Data Element Framework . [3] The Open Group — это нейтральный по отношению к поставщикам и технологиям консорциум, работающий над обеспечением доступа к интегрированной информации внутри предприятий и между ними на основе открытых стандартов и глобальной совместимости .
Хотя реестр метаданных ISO/IEC 11179 является стандартом из 6 частей, включающим несколько сотен страниц, основная модель представлена в Части 3 и изображена в диаграммах UML для облегчения понимания, подкрепленных нормативным текстом. Инициатива eXtended Metadata Registry, XMDR, возглавляемая США, исследовала использование онтологий в качестве основы для контента MDR, чтобы обеспечить более богатую семантическую структуру, чем можно было бы достичь только с помощью лексических и синтаксических соглашений об именовании. XMDR экспериментировал с прототипом, используя OWL, RDF и SPARQL, чтобы доказать концепцию. Инициатива привела к Изданию 3 ISO/IEC 11179. Первая опубликованная часть — ISO/IEC 11179-3:2013. Основное расширение в Издании 3 — это область концепций, расширяющая использование концепций на большее количество компонентов в стандарте и поддерживающая регистрацию системы концепций для использования в реестре. Стандарт также поддерживает использование внешне определенных систем концепций. Версии 3-го издания частей 1, 5 и 6 были опубликованы в 2015 году. Часть 2, Классификации, включена в область концепций в Части 3, но обновляется до Технического отчета (TR) для предоставления руководства по разработке схем классификации. Часть 4 описывает принципы формирования определений данных; 3-е издание не предлагалось.
Следующие реестры метаданных заявляют, что они следуют рекомендациям ISO/IEC 11179, хотя официальных сторонних тестов для проверки соответствия реестра метаданных не разработано.
Ни одно независимое агентство не сертифицирует соответствие ISO/IEC 11179. В некоторой степени некоторые существующие реализации программного обеспечения страдают от плохой конструкции и потенциальных уязвимостей безопасности, что препятствует принятию ISO/IEC 11179.
Открытые метаданные