Эта статья включает список ссылок , связанных чтений или внешних ссылок , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Июль 2018 г. ) |
В компьютерном зрении визуальные дескрипторы или дескрипторы изображений являются описаниями визуальных особенностей содержимого в изображениях , видео или алгоритмах или приложениях, которые производят такие описания. Они описывают элементарные характеристики, такие как форма , цвет , текстура или движение , среди прочих.
В результате новых коммуникационных технологий и массового использования Интернета в нашем обществе, объем аудиовизуальной информации, доступной в цифровом формате, значительно увеличивается. Поэтому возникла необходимость в разработке некоторых систем, которые позволяют нам описывать содержание нескольких типов мультимедийной информации с целью их поиска и классификации.
Аудиовизуальные дескрипторы отвечают за описание контента. Эти дескрипторы хорошо разбираются в объектах и событиях, обнаруженных в видео, изображении или аудио , и позволяют быстро и эффективно искать аудиовизуальный контент.
Эту систему можно сравнить с поисковыми системами текстового контента. Хотя относительно легко найти текст с помощью компьютера, гораздо сложнее найти конкретные аудио- и видеочасти. Например, представьте, что кто-то ищет сцену счастливого человека. Счастье — это чувство, и его форма, цвет и описание текстуры не очевидны на изображениях.
Описание аудиовизуального контента не является поверхностной задачей и имеет важное значение для эффективного использования этого типа архивов. Система стандартизации, которая имеет дело с аудиовизуальными дескрипторами, называется MPEG-7 ( Motion Picture Expert Group - 7 ).
Дескрипторы — это первый шаг к выявлению связи между пикселями, содержащимися в цифровом изображении , и тем, что люди вспоминают после наблюдения изображения или группы изображений через несколько минут.
Визуальные дескрипторы делятся на две основные группы:
Общие информационные дескрипторы состоят из набора дескрипторов, которые охватывают различные базовые и элементарные характеристики, такие как: цвет, текстура, форма, движение, местоположение и др. Это описание автоматически генерируется с помощью обработки сигнала .
Это самое базовое качество визуального контента. Для описания цвета определены пять инструментов. Первые три инструмента представляют распределение цвета, а последние описывают цветовые отношения между последовательностями или группами изображений :
Это важное качество для описания изображения. Текстурные дескрипторы характеризуют текстуры или области изображения. Они наблюдают однородность области и гистограммы границ этих областей. Набор дескрипторов формируется:
Он содержит важную семантическую информацию, обусловленную способностью человека распознавать объекты по их форме. Однако эта информация может быть извлечена только посредством сегментации, аналогичной той, которую реализует зрительная система человека. В настоящее время такая система сегментации пока недоступна, однако существует ряд алгоритмов, которые считаются хорошим приближением. Эти дескрипторы описывают области, контуры и формы для 2D- изображений и для 3D- объемов. Дескрипторы формы следующие:
Он определяется четырьмя различными дескрипторами, которые описывают движение в видеопоследовательности . Движение связано с движением объектов в последовательности и с движением камеры . Эта последняя информация предоставляется устройством захвата, тогда как остальная часть реализуется посредством обработки изображений . Набор дескрипторов следующий:
Расположение элементов на изображении используется для описания элементов в пространственной области. Кроме того, элементы могут быть также расположены во временной области:
Эти дескрипторы, которые дают информацию об объектах и событиях в сцене, нелегко извлечь, тем более, когда извлечение должно быть выполнено автоматически. Тем не менее, их можно обрабатывать вручную.
Как упоминалось ранее, распознавание лиц — это конкретный пример приложения, которое пытается автоматически получить эту информацию.
Среди всех приложений наиболее важными являются: