Исправление изображения

Процесс преобразования для проецирования изображений
Камера (красная) вращается вокруг синей оси на 5°–90° (зеленая), так как изображения выпрямляются проекцией на виртуальную плоскость изображения (синяя). Виртуальная плоскость должна быть параллельна стереобазе (оранжевая) и для визуализации расположена в центре вращения. В этом случае выпрямление достигается виртуальным вращением красной и зеленой плоскостей изображения соответственно, чтобы они были параллельны стереобазе.

Ректификация изображений — это процесс преобразования, используемый для проецирования изображений на общую плоскость изображения. Этот процесс имеет несколько степеней свободы, и существует множество стратегий преобразования изображений в общую плоскость. Ректификация изображений используется в компьютерном стереозрении для упрощения задачи поиска точек соответствия между изображениями (т. е. задачи соответствия ), а также в географических информационных системах (ГИС) для объединения изображений, полученных с разных точек зрения, в общую систему координат карты.

В компьютерном зрении

Поиск соответствия точки ограничен линией на правом изображении. Поскольку изображения не ректифицированы, линия наклонная. После ректификации она будет горизонтальной. х Л {\displaystyle \mathbf {x} _{L}} е Р х Р ¯ {\displaystyle {\overline {\mathbf {e} _{R}\mathbf {x} _{R}}}} е Р х Р ¯ {\displaystyle {\overline {\mathbf {e} _{R}\mathbf {x} _{R}}}}

Компьютерное стереозрение берет два или более изображений с известными относительными положениями камеры, которые показывают объект с разных точек зрения. Затем для каждого пикселя он определяет глубину соответствующей точки сцены (т. е. расстояние от камеры), сначала находя совпадающие пиксели (т. е. пиксели, показывающие ту же точку сцены) на другом изображении(ях), а затем применяя триангуляцию к найденным совпадениям для определения их глубины. Поиск совпадений в стереозрении ограничен эпиполярной геометрией : совпадение каждого пикселя на другом изображении может быть найдено только на линии, называемой эпиполярной линией. Если два изображения копланарны, т. е. они были сделаны таким образом, что правая камера смещена только по горизонтали по сравнению с левой камерой (не перемещается к объекту и не поворачивается), то эпиполярная линия каждого пикселя горизонтальна и находится в том же вертикальном положении, что и этот пиксель. Однако в общих настройках (камера перемещается к объекту или поворачивается) эпиполярные линии наклонены. Ректификация изображения деформирует оба изображения таким образом, что они выглядят так, как будто они были сделаны только с горизонтальным смещением, и, как следствие, все эпиполярные линии горизонтальны, что немного упрощает процесс стереосопоставления. Однако следует отметить, что ректификация принципиально не меняет процесс стереосопоставления: она ищет линии, наклонные до и горизонтальные после ректификации.

Ректификация изображения также является эквивалентной (и более часто используемой [1] ) альтернативой идеальной копланарности камеры. Даже при использовании высокоточного оборудования обычно выполняется ректификация изображения, поскольку может быть непрактично поддерживать идеальную копланарность между камерами.

Корректировка изображений может быть выполнена только для двух изображений одновременно, а одновременная коррекция более двух изображений, как правило, невозможна. [2]

Трансформация

Если изображения, которые необходимо исправить, получены с пар камер без геометрических искажений , этот расчет можно легко выполнить с помощью линейного преобразования . Вращение по осям X и Y помещает изображения в одну плоскость, масштабирование делает кадры изображения одинаковыми по размеру, а вращение по оси Z и корректировка наклона заставляют ряды пикселей изображения напрямую выстраиваться в линию [ необходима ссылка ] . Необходимо знать жесткое выравнивание камер (путем калибровки), а коэффициенты калибровки используются преобразованием. [3]

При выполнении преобразования, если сами камеры откалиброваны по внутренним параметрам, существенная матрица обеспечивает связь между камерами. Более общий случай (без калибровки камеры) представлен фундаментальной матрицей . Если фундаментальная матрица неизвестна, необходимо найти предварительные точечные соответствия между стереоизображениями, чтобы облегчить ее извлечение. [3]

Алгоритмы

Существует три основные категории алгоритмов ректификации изображений: планарная ректификация, [4] цилиндрическая ректификация [1] и полярная ректификация. [5] [6] [7]

Подробности реализации

Все исправленные изображения удовлетворяют следующим двум свойствам: [8]

  • Все эпиполярные линии параллельны горизонтальной оси.
  • Соответствующие точки имеют одинаковые вертикальные координаты.

Чтобы преобразовать исходную пару изображений в пару исправленных изображений, необходимо найти проективное преобразование H. На H накладываются ограничения , чтобы удовлетворить двум свойствам, указанным выше. Например, ограничение эпиполярных линий параллельностью горизонтальной оси означает, что эпиполюса должны быть отображены в бесконечную точку [1,0,0] T в однородных координатах . Даже с этими ограничениями H все еще имеет четыре степени свободы. [9] Также необходимо найти соответствующее H' для исправления второго изображения пары изображений. Неудачный выбор H и H' может привести к получению исправленных изображений, которые будут резко изменены в масштабе или сильно искажены.

Существует множество различных стратегий выбора проективного преобразования H для каждого изображения из всех возможных решений. Один из продвинутых методов заключается в минимизации диспаратности или разности наименьших квадратов соответствующих точек на горизонтальной оси пары выпрямленных изображений. [9] Другой метод заключается в разделении H на специализированное проективное преобразование, преобразование подобия и преобразование сдвига для минимизации искажения изображения. [8] Один из простых методов заключается в повороте обоих изображений так, чтобы они смотрели перпендикулярно линии, соединяющей их коллективные оптические центры, повороте оптических осей так, чтобы горизонтальная ось каждого изображения указывала в направлении оптического центра другого изображения, и, наконец, масштабировании меньшего изображения для соответствия линии к линии. [2] Этот процесс демонстрируется в следующем примере.

Пример

Модель, используемая для примера исправления изображения.
3D-вид примера сцены. Оптический центр первой камеры и плоскость изображения представлены зеленым кругом и квадратом соответственно. Вторая камера имеет аналогичные красные представления.
Набор 2D-изображений из примера. Исходные изображения взяты с разных точек зрения (строка 1). Используя систематические преобразования из примера (строки 2 и 3), мы можем преобразовать оба изображения таким образом, чтобы соответствующие точки находились на тех же горизонтальных линиях сканирования (строка 4).

Наша модель для этого примера основана на паре изображений, которые наблюдают 3D-точку P , которая соответствует p и p' в пиксельных координатах каждого изображения. O и O' представляют оптические центры каждой камеры с известными матрицами камеры и (мы предполагаем, что начало координат находится в первой камере). Мы кратко опишем и изобразим результаты для простого подхода к поиску проективного преобразования H и H' , которое исправляет пару изображений из сцены-примера. М = К [ я   0 ] {\displaystyle М=К[I~0]} М = К [ Р   Т ] {\displaystyle M'=K'[R~T]}

Сначала мы вычисляем эпиполи e и e' на каждом изображении:

е = М [ О 1 ] = М [ Р Т Т 1 ] = К [ я   0 ] [ Р Т Т 1 ] = К Р Т Т {\displaystyle e=M{\begin{bmatrix}O'\\1\end{bmatrix}}=M{\begin{bmatrix}-R^{T}T\\1\end{bmatrix}}=K[I~0]{\begin{bmatrix}-R^{T}T\\1\end{bmatrix}}=-KR^{T}T}
е = М [ О 1 ] = М [ 0 1 ] = К [ Р   Т ] [ 0 1 ] = К Т {\displaystyle e'=M'{\begin{bmatrix}O\\1\end{bmatrix}}=M'{\begin{bmatrix}0\\1\end{bmatrix}}=K'[R~T]{\begin{bmatrix}0\\1\end{bmatrix}}=K'T}

Во-вторых, мы находим проективное преобразование H 1 , которое поворачивает наше первое изображение так, чтобы оно было параллельно базовой линии, соединяющей O и O' (строка 2, столбец 1 набора 2D-изображений). Это вращение можно найти, используя векторное произведение между исходной и желаемой оптическими осями. [2] Затем мы находим проективное преобразование H 2 , которое берет повернутое изображение и поворачивает его так, чтобы горизонтальная ось совпадала с базовой линией. Если вычислено правильно, это второе преобразование должно отобразить e в бесконечность на оси x (строка 3, столбец 1 набора 2D-изображений). Наконец, определяем как проективное преобразование для исправления первого изображения. ЧАС = ЧАС 2 ЧАС 1 {\displaystyle H=H_{2}H_{1}}

В-третьих, с помощью эквивалентной операции мы можем найти H' для исправления второго изображения (столбец 2 набора двумерных изображений). Обратите внимание, что H' 1 должен повернуть оптическую ось второго изображения так, чтобы она была параллельна преобразованной оптической оси первого изображения. Одна из стратегий заключается в выборе плоскости, параллельной линии, где пересекаются две исходные оптические оси, чтобы минимизировать искажения от процесса повторного проецирования. [10] В этом примере мы просто определяем H' с помощью матрицы вращения R и начального проективного преобразования H как . ЧАС = ЧАС Р Т {\displaystyle H'=HR^{T}}

Наконец, мы масштабируем оба изображения до приблизительно одинакового разрешения и выравниваем теперь горизонтальные эпиполи для более легкого горизонтального сканирования на предмет соответствий (строка 4 набора 2D-изображений).

Обратите внимание, что можно выполнить этот и подобные алгоритмы без матриц параметров камеры M и M' . Все, что требуется, это набор из семи или более соответствий изображения к изображению для вычисления фундаментальных матриц и эпиполей. [9]

В географической информационной системе

Ректификация изображений в ГИС преобразует изображения в стандартную систему координат карты. Это делается путем сопоставления опорных точек наземного уровня (GCP) в системе картографирования с точками на изображении. Эти опорные точки вычисляют необходимые преобразования изображения. [11]

Основные трудности в процессе возникают

  • когда точность точек карты не очень известна
  • когда на изображениях отсутствуют четко идентифицируемые точки, соответствующие картам.

Карты, которые используются с исправленными изображениями, не являются топографическими. Однако изображения, которые будут использоваться, могут содержать искажения от рельефа. Ортотрансформация изображений дополнительно устраняет эти эффекты. [11]

Исправление изображений — стандартная функция, доступная в пакетах программного обеспечения ГИС.

Смотрите также

Ссылки

  1. ^ ab Oram, Daniel (2001). Ректификация для любой эпиполярной геометрии .
  2. ^ abc Szeliski, Richard (2010). Компьютерное зрение: алгоритмы и приложения. Springer. ISBN 9781848829350.
  3. ^ ab Fusiello, Andrea (2000-03-17). "Эпиполярная ректификация". Архивировано из оригинала 2015-11-13 . Получено 2008-06-09 .
  4. ^ Fusiello, Andrea; Trucco, Emanuele; Verri, Alessandro (2000-03-02). "Компактный алгоритм для ректификации стереопар" (PDF) . Machine Vision and Applications . 12 : 16–22. doi :10.1007/s001380050120. S2CID  13250851. Архивировано из оригинала (PDF) 2015-09-23 . Получено 2010-06-08 .
  5. ^ Поллефейс, Марк; Кох, Рейнхард; Ван Гул, Люк (1999). «Простой и эффективный метод ректификации для общего движения» (PDF) . Proc. Международная конференция по компьютерному зрению : 496–501 . Получено 19.01.2011 .
  6. ^ Лим, Сер-Нам; Миттал, Анураг; Дэвис, Ларри; Парагиос, Никос. "Некалиброванная стереоректификация для автоматического 3D-наблюдения" (PDF) . Международная конференция по обработке изображений . 2 : 1357. Архивировано из оригинала (PDF) 2010-08-21 . Получено 2010-06-08 .
  7. ^ Роберто, Рафаэль; Тейхриб, Вероника; Келнер, Джудит (2009). «Цилиндрическая коррекция: эффективный метод для ретификации изображений» (PDF) . Мастер-классы Сибграпи 2009 – Бакалаврские работы (на португальском языке). Архивировано из оригинала (PDF) 6 июля 2011 г. Проверено 5 марта 2011 г.
  8. ^ ab Loop, Charles; Zhang, Zhengyou (1999). "Вычислительные ректифицирующие гомографии для стереозрения" (PDF) . Труды. 1999 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (Cat. No PR00149) . стр. 125–131. CiteSeerX 10.1.1.34.6182 . doi :10.1109/CVPR.1999.786928. ISBN  978-0-7695-0149-9. S2CID  157172 . Получено 2014-11-09 .
  9. ^ abc Хартли, Ричард; Зиссерман, Эндрю (2003). Многовидовая геометрия в компьютерном зрении. Издательство Кембриджского университета. ISBN 9780521540513.
  10. ^ Форсайт, Дэвид А.; Понсе, Джин (2002). Компьютерное зрение: современный подход . Профессиональный технический справочник Prentice Hall.
  11. ^ ab Fogel, David. "Image Rectification with Radial Basis Functions". Архивировано из оригинала 2008-05-24 . Получено 2008-06-09 .
  • Хартли, RI (1999). «Теория и практика проективной ректификации». Международный журнал компьютерного зрения . 35 (2): 115–127. doi :10.1023/A:1008115206617. S2CID  406463.
  • Поллефейс, Марк. "Полярная ректификация" . Получено 09.06.2007 .
  • Шапиро, Линда Г.; Стокман, Джордж К. (2001). Компьютерное зрение . Prentice Hall. стр. 580. ISBN 978-0-13-030796-5.

Дальнейшее чтение

  • Вычисление ректифицирующих гомографий для стереозрения Чарльза Лупа и Чжэнъю Чжана (8 апреля 1999 г.) Microsoft Research
  • Компьютерное зрение: алгоритмы и приложения, раздел 11.1.1 «Ректификация» Ричарда Селиски (3 сентября 2010 г.) Springerdheerajnkumar
Взято с "https://en.wikipedia.org/w/index.php?title=Image_rectification&oldid=1255144482"