В области компьютерного зрения любые два изображения одной и той же плоской поверхности в пространстве связаны гомографией ( предполагая модель камеры-обскуры ). Это имеет множество практических применений, таких как ректификация изображений , регистрация изображений или движение камеры — вращение и трансляция — между двумя изображениями. После того, как резекция камеры была выполнена из оценочной матрицы гомографии, эта информация может использоваться для навигации или для вставки моделей 3D-объектов в изображение или видео, так что они визуализируются с правильной перспективой и кажутся частью исходной сцены (см. Дополненная реальность ).
3D уравнение плоскости к плоскости
У нас есть две камеры a и b , смотрящие на точки на плоскости. Переходя от проекции в b к проекции в a :
где и — координаты z точки P в каждом кадре камеры, а матрица гомографии задается выражением
.
— матрица поворота, с помощью которой b поворачивается относительно a ; t — вектор перемещения от a к b ; n и d — нормальный вектор плоскости и расстояние от начала координат до плоскости соответственно. K a и K b — матрицы внутренних параметров камер .
На рисунке показана камера b, смотрящая на плоскость на расстоянии d . Примечание: Из рисунка выше, предполагая, что в качестве модели плоскости, есть проекция вектора вдоль , и равна . Так что . И мы имеем , где .
Эта формула действительна только если камера b не имеет вращения и перемещения. В общем случае, где и являются соответствующими вращениями и перемещениями камер a и b , а матрица гомографии становится
где d — расстояние камеры b до плоскости.
Аффинная гомография
Когда область изображения, в которой вычисляется гомография, мала или изображение получено с большим фокусным расстоянием, аффинная гомография является более подходящей моделью смещения изображения. Аффинная гомография является особым типом общей гомографии, последняя строка которой зафиксирована на
O. Chum и T. Pajdla и P. Sturm (2005). "Геометрическая ошибка для гомографий" (PDF) . Компьютерное зрение и понимание изображений . 97 (1): 86– 102. doi :10.1016/j.cviu.2004.03.004.
OpenCV — это полная ( открытая и бесплатная ) библиотека программного обеспечения для компьютерного зрения, которая содержит множество процедур, связанных с оценкой гомографии (cvFindHomography) и повторным проецированием (cvPerspectiveTransform).
А. Криминизи, И. Рейд и А. Зиссерман (1997) «Устройство для измерения плоскости», §3 Вычисление гомографии плоскости к плоскости, из Visual Geometry Group, Department of Engineering Science, Oxford University .
Учебник по GIMP – использование инструмента «Перспектива» от Билли Керра на YouTube . Показывает, как выполнить преобразование перспективы с помощью GIMP .
Аллан Джепсон (2010) Плоские гомографии из Департамента компьютерных наук, Университет Торонто . Включает 2D-гомографию из четырех пар соответствующих точек, мозаику в обработке изображений, устранение перспективных искажений в компьютерном зрении, рендеринг текстур в компьютерной графике и вычисление плоских теней.
Этьен Винсент и Роберт Лаганьер (2000) Обнаружение плоских гомографий в паре изображений Архивировано 2016-03-04 в Wayback Machine из Школы информационных технологий и инженерии, Университет Оттавы . Описывает алгоритм обнаружения плоскостей в изображениях, использует метод случайного консенсуса выборки ( RANSAC ), описывает эвристики и итерации.