Эта статья включает список общих ссылок , но в ней отсутствуют соответствующие встроенные цитаты . ( Август 2017 ) |
Классификация данных — это процесс организации данных в категории на основе таких атрибутов, как тип файла, содержимое или метаданные . Затем данным присваиваются метки классов , которые описывают набор атрибутов для соответствующих наборов данных . Цель состоит в том, чтобы предоставить значимые атрибуты классов ранее менее структурированной информации.
Классификацию данных можно рассматривать как множество меток, которые используются для определения типа данных, особенно в вопросах конфиденциальности и целостности. [1] Классификация данных обычно является ручным процессом; однако существуют инструменты, которые могут помочь собрать информацию о данных. [2] Часто предлагается учитывать уровни конфиденциальности данных. [2]
Корпоративная политика классификации данных устанавливает, как сотрудники должны обращаться с различными типами данных, с которыми они работают. Автоматизированные методы классификации иногда применяются программными алгоритмами на основе ключевых слов или фраз в контенте для его анализа и классификации. Она может использоваться для отчетов, созданных системами ERP , или когда данные включают определенную личную информацию , которая идентифицируется. В некоторых случаях сотрудники могут нести ответственность за принятие решения о том, какая метка является подходящей. [3]