Эта статья включает список ссылок , связанных чтений или внешних ссылок , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Июль 2018 г. ) |
В компьютерном зрении визуальные дескрипторы или дескрипторы изображений являются описаниями визуальных особенностей содержимого в изображениях , видео или алгоритмах или приложениях, которые производят такие описания. Они описывают элементарные характеристики, такие как форма , цвет , текстура или движение , среди прочих.
В результате новых коммуникационных технологий и массового использования Интернета в нашем обществе, объем аудиовизуальной информации, доступной в цифровом формате, значительно увеличивается. Поэтому возникла необходимость в разработке некоторых систем, которые позволяют нам описывать содержание нескольких типов мультимедийной информации с целью их поиска и классификации.
Аудиовизуальные дескрипторы отвечают за описание контента. Эти дескрипторы хорошо разбираются в объектах и событиях, обнаруженных в видео, изображении или аудио , и позволяют быстро и эффективно искать аудиовизуальный контент.
Эту систему можно сравнить с поисковыми системами текстового контента. Хотя относительно легко найти текст с помощью компьютера, гораздо сложнее найти конкретные аудио- и видеочасти. Например, представьте, что кто-то ищет сцену счастливого человека. Счастье — это чувство, и его форма, цвет и описание текстуры не очевидны на изображениях.
Описание аудиовизуального контента не является поверхностной задачей и имеет важное значение для эффективного использования этого типа архивов. Система стандартизации, которая имеет дело с аудиовизуальными дескрипторами, называется MPEG-7 ( Motion Picture Expert Group - 7 ).
Дескрипторы — это первый шаг к выявлению связи между пикселями, содержащимися в цифровом изображении , и тем, что люди вспоминают после наблюдения изображения или группы изображений через несколько минут.
Визуальные дескрипторы делятся на две основные группы:
Общие информационные дескрипторы состоят из набора дескрипторов, которые охватывают различные базовые и элементарные характеристики, такие как: цвет, текстура, форма, движение, местоположение и др. Это описание автоматически генерируется с помощью обработки сигнала .
Это самое базовое качество визуального контента. Для описания цвета определены пять инструментов. Первые три инструмента представляют распределение цвета, а последние описывают цветовые отношения между последовательностями или группами изображений :
Это важное качество для описания изображения. Текстурные дескрипторы характеризуют текстуры или области изображения. Они наблюдают однородность области и гистограммы границ этих областей. Набор дескрипторов формируется:
Он содержит важную семантическую информацию, обусловленную способностью человека распознавать объекты по их форме. Однако эта информация может быть извлечена только посредством сегментации, аналогичной той, которую реализует зрительная система человека. В настоящее время такая система сегментации пока недоступна, однако существует ряд алгоритмов, которые считаются хорошим приближением. Эти дескрипторы описывают области, контуры и формы для 2D- изображений и для 3D- объемов. Дескрипторы формы следующие:
Он определяется четырьмя различными дескрипторами, которые описывают движение в видеопоследовательности . Движение связано с движением объектов в последовательности и с движением камеры . Эта последняя информация предоставляется устройством захвата, тогда как остальная часть реализуется посредством обработки изображений . Набор дескрипторов следующий:
Расположение элементов на изображении используется для описания элементов в пространственной области. Кроме того, элементы могут быть также расположены во временной области:
Эти дескрипторы, которые дают информацию об объектах и событиях в сцене, нелегко извлечь, тем более, когда извлечение должно быть выполнено автоматически. Тем не менее, их можно обрабатывать вручную.
Как упоминалось ранее, распознавание лиц является конкретным примером приложения, которое пытается автоматически получить эту информацию.
Среди всех приложений наиболее важными являются: