Архитектура данных состоит из моделей, политик, правил и стандартов, которые определяют, какие данные собираются и как они хранятся, упорядочиваются, интегрируются и используются в системах данных и в организациях. [1] Данные обычно являются одним из нескольких доменов архитектуры , которые формируют столпы архитектуры предприятия или архитектуры решения . [2]
Архитектура данных направлена на установление стандартов данных для всех ее систем данных как видения или модели возможных взаимодействий между этими системами данных. Интеграция данных , например, должна зависеть от стандартов архитектуры данных, поскольку интеграция данных требует взаимодействия данных между двумя или более системами данных. Архитектура данных, в частности, описывает структуры данных, используемые бизнесом и его компьютерными приложениями . Архитектуры данных рассматривают данные в хранилище, данные в использовании и данные в движении; описания хранилищ данных, групп данных и элементов данных; и сопоставления этих артефактов данных с качествами данных, приложениями, местоположениями и т. д.
Необходимая для реализации целевого состояния архитектура данных описывает, как данные обрабатываются, хранятся и используются в информационной системе . Она предоставляет критерии для операций обработки данных , чтобы сделать возможным проектирование потоков данных , а также управление потоками данных в системе.
Архитектор данных обычно отвечает за определение целевого состояния, согласование в ходе разработки и последующий контроль, чтобы гарантировать, что улучшения вносятся в духе исходного проекта.
Во время определения целевого состояния архитектура данных разбивает субъект на атомарный уровень, а затем снова выстраивает его в желаемую форму. Архитектор данных разбивает субъект, проходя через три традиционных архитектурных этапа:
Столбец «данные» в структуре Захмана для корпоративной архитектуры –
Слой | Вид | Данные (Что) | Заинтересованная сторона |
1 | Область применения/Контекстуальность | Список вещей и архитектурных стандартов [3], важных для бизнеса | Планировщик |
2 | Бизнес-модель/Концептуальная | Семантическая модель или концептуальная / корпоративная модель данных | Владелец |
3 | Модель системы/Логическая | Корпоративная/ Логическая модель данных | Дизайнер |
4 | Технологическая модель/физическая | Физическая модель данных | Строитель |
5 | Подробные представления | Действующие базы данных | Разработчик |
Во втором, более широком смысле архитектура данных включает в себя полный анализ взаимосвязей между функциями организации, доступными технологиями и типами данных .
Архитектура данных должна быть определена на этапе планирования проектирования новой системы обработки и хранения данных. Основные типы и источники данных, необходимые для поддержки предприятия, должны быть определены таким образом, чтобы они были полными, последовательными и понятными. Основное требование на этом этапе — определить все соответствующие сущности данных, а не указывать элементы компьютерного оборудования . Сущность данных — это любая реальная или абстрактная вещь, о которой организация или отдельное лицо желает хранить данные.
Физическая архитектура данных информационной системы является частью технологического плана . Технологический план фокусируется на фактических осязаемых элементах , которые будут использоваться при реализации проекта архитектуры данных . Физическая архитектура данных охватывает архитектуру базы данных. Архитектура базы данных — это схема фактической технологии базы данных, которая будет поддерживать спроектированную архитектуру данных.
Определенные элементы должны быть определены на этапе проектирования схемы архитектуры данных. Например, должна быть описана административная структура, которая должна быть создана для управления ресурсами данных. Также должны быть определены методологии, которые должны использоваться для хранения данных. Кроме того, должно быть создано описание технологии базы данных, которая будет использоваться, а также описание процессов, которые должны манипулировать данными. Также важно разработать интерфейсы к данным другими системами, а также проект инфраструктуры , которая должна поддерживать общие операции с данными (т. е. процедуры экстренного реагирования, импорт данных , резервное копирование данных , внешние передачи данных ).
Без руководства правильно реализованного дизайна архитектуры данных общие операции с данными могут быть реализованы по-разному, что затрудняет понимание и управление потоком данных в таких системах. Такого рода фрагментация нежелательна из-за потенциального увеличения стоимости и связанных с этим разрывов данных. С подобными трудностями могут столкнуться быстрорастущие предприятия, а также предприятия, обслуживающие различные направления бизнеса .
Правильно выполненная фаза архитектуры данных планирования информационной системы заставляет организацию определять и описывать как внутренние, так и внешние информационные потоки. Это шаблоны, на концептуализацию которых организация, возможно, ранее не тратила время. Поэтому на этом этапе можно выявить дорогостоящие информационные дефициты, разрывы между отделами и разрывы между организационными системами, которые могли не быть очевидными до анализа архитектуры данных. [4]
Различные ограничения и влияния будут влиять на проектирование архитектуры данных. Они включают требования предприятия, технологические драйверы, экономику, бизнес-политику и потребности в обработке данных.
{{cite book}}
: CS1 maint: местоположение ( ссылка )