WikiDer > Триангуляция (компьютерное зрение)
В компьютерное зрение триангуляция относится к процессу определения точки в трехмерном пространстве по ее проекциям на два или более изображений. Чтобы решить эту проблему, необходимо знать параметры функции проецирования камеры из 3D в 2D для задействованных камер, в простейшем случае представленный матрицы камеры. Триангуляцию иногда также называют реконструкция или же пересечение.
Задача триангуляции в принципе тривиальна. Поскольку каждая точка на изображении соответствует линии в трехмерном пространстве, все точки на линии в трехмерном пространстве проецируются на точку на изображении. Если пара соответствующие точки на двух или более изображениях могут быть найдены, это должно быть так, что они являются проекцией общей трехмерной точки Икс. Набор линий, образованных точками изображения, должен пересекаться в Икс (Трехмерная точка) и алгебраическая формулировка координат Икс (Трехмерная точка) может быть вычислена различными способами, как показано ниже.
Однако на практике координаты точек изображения не могут быть измерены с произвольной точностью. Вместо этого различные типы шума, такие как геометрический шум из-за искажения объектива или ошибки обнаружения точки интереса, приводят к неточностям в измеренных координатах изображения. Как следствие, линии, образованные соответствующими точками изображения, не всегда пересекаются в трехмерном пространстве. Таким образом, проблема состоит в том, чтобы найти трехмерную точку, которая оптимально соответствует измеренным точкам изображения. В литературе есть множество предложений о том, как определить оптимальность и как найти оптимальную трехмерную точку. Поскольку они основаны на разных критериях оптимальности, разные методы дают разные оценки трехмерной точки. Икс когда присутствует шум.
Вступление
В дальнейшем предполагается, что триангуляция выполняется на соответствующих точках изображения из двух видов, созданных с помощью камеры-обскуры. Обсуждаются обобщения этих предположений. здесь.
Изображение слева иллюстрирует эпиполярная геометрия пары стереокамер модель точечного отверстия. Точка Икс (3D-точка) в 3D-пространстве проецируется на соответствующую плоскость изображения по линии (зеленой), проходящей через координационный центр, и , в результате чего две соответствующие точки изображения и . Если и даны и геометрия двух камер известна, две линии проекции (зеленые линии) могут быть определены, и они должны пересекаться в точке Икс (3D точка). Используя базовый линейная алгебра эту точку пересечения можно определить простым способом.
Изображение справа показывает реальный случай. Положение точек изображения и нельзя точно измерить. Причина - сочетание таких факторов, как
- Например, геометрическое искажение искажение объектива, что означает, что преобразование камеры из 3D в 2D отличается от модель камеры-обскуры. В некоторой степени эти ошибки можно компенсировать, оставив остаточную геометрическую ошибку.
- Единственный луч света от Икс (3D-точка) рассеивается в системе линз камер в соответствии с функция разброса точки. Восстановление соответствующей точки изображения по измерениям дисперсной функции интенсивности на изображениях дает ошибки.
- В цифровой камере функция интенсивности изображения измеряется только в дискретных сенсорных элементах. Чтобы восстановить истинную, необходимо использовать неточную интерполяцию дискретной функции интенсивности.
- Изображение указывает у1' и у2' часто используются для триангуляции с использованием различных типов экстракторов признаков, например углов или точек интереса в целом. Существует внутренняя ошибка локализации для любого типа извлечения признаков на основе районные операции.
Как следствие, измеренные точки изображения и вместо и . Однако их линии проекции (синие) не должны пересекаться в трехмерном пространстве или приближаться к Икс. На самом деле эти прямые пересекаются тогда и только тогда, когда и удовлетворить эпиполярное ограничение определяется фундаментальная матрица. Учитывая шум измерения в и весьма вероятно, что эпиполярное ограничение не выполняется и линии проекции не пересекаются.
Это наблюдение приводит к проблеме, которую решает триангуляция. Какая 3D точка Иксстандартное восточное время это лучшая оценка Икс данный и а геометрия камер? Ответ часто находится путем определения меры погрешности, которая зависит от Иксстандартное восточное время а затем минимизировать эту ошибку. В следующих разделах рассматриваются некоторые из различных методов вычисления Иксстандартное восточное время представленные в литературе кратко описаны.
Все методы триангуляции производят Иксстандартное восточное время = Икс в случае, если и , то есть когда выполняется эпиполярное ограничение (кроме особых точек, см. ниже). То, что происходит, когда ограничение не выполняется, что различается между методами.
Характеристики
Метод триангуляции можно описать с помощью функции такой, что
куда - однородные координаты точек детектированного изображения и матрицы камеры. Икс (3D-точка) - однородное представление полученной 3D-точки. В знак означает, что требуется только для создания вектора, который равен Икс с точностью до умножения на ненулевой скаляр, поскольку используются однородные векторы.
Прежде чем рассматривать конкретные методы, то есть конкретные функции , есть некоторые общие концепции, связанные с методами, которые необходимо объяснить. Выбор метода триангуляции для конкретной задачи в некоторой степени зависит от этих характеристик.
Особенности
Некоторые методы не позволяют правильно вычислить оценку Икс (3D-точка), если она лежит в определенном подмножестве 3D-пространства, соответствующем некоторой комбинации . Точка в этом подмножестве тогда является необычность метода триангуляции. Причина неудачи может заключаться в том, что некоторая решаемая система уравнений недоопределена или что проективное представление Иксстандартное восточное время становится нулевым вектором для особых точек.
Инвариантность
В некоторых приложениях желательно, чтобы триангуляция не зависела от системы координат, используемой для представления трехмерных точек; если задачу триангуляции сформулировать в одной системе координат, а затем преобразовать в другую, то получится оценка Иксстандартное восточное время должны преобразоваться таким же образом. Это свойство обычно называют инвариантность. Не каждый метод триангуляции обеспечивает инвариантность, по крайней мере, не для общих типов преобразований координат.
Для однородного представления трехмерных координат наиболее общим преобразованием является проективное преобразование, представленное матрица . Если однородные координаты преобразовать согласно
то матрицы камеры должны преобразоваться как (Ck)
для получения одинаковых однородных координат изображения (уk)
Если функция триангуляции инвариантен к то должно выполняться следующее соотношение
откуда следует, что
- для всех
Для каждого метода триангуляции можно определить, действительно ли это последнее соотношение. Если это так, это может быть выполнено только для подмножества проективных преобразований, например жестких или аффинных преобразований.
Вычислительная сложность
Функция является лишь абстрактным представлением вычисления, которое на практике может быть относительно сложным. Некоторые методы приводят к которая является непрерывной функцией замкнутой формы, в то время как другие необходимо разложить на серию вычислительных шагов, включающих, например, СВД или найти корни многочлена. Еще один класс методов приводит к который должен полагаться на итеративную оценку некоторых параметров. Это означает, что как время вычислений, так и сложность задействованных операций могут различаться для разных методов.
Методы
Метод средней точки
Каждая из двух точек изображения и имеет соответствующую линию проекции (синюю на правом изображении выше), здесь обозначенную как и , который можно определить по матрицам камер . Позволять быть функцией расстояния между (3D линией) L1' и Икс (3D-точка) такая, что это евклидово расстояние между и . метод средней точки находит точку Иксстандартное восточное время что сводит к минимуму
Оказывается, что Иксстандартное восточное время лежит точно в середине самого короткого отрезка линии, соединяющего две линии проекции.
Прямое линейное преобразование
Через существенную матрицу
Проблема, которую предстоит решить, заключается в том, как вычислить с учетом соответствующих нормализованных координат изображения и . Если основная матрица известен и соответствующие преобразования поворота и сдвига определены, этот алгоритм (описанный в статье Лонге-Хиггинса) обеспечивает решение.
Позволять обозначить строку k матрицы вращения :
Комбинирование вышеуказанных отношений между трехмерными координатами в двух системах координат и сопоставления между трехмерными и двумерными точками, описанными ранее, дает
или же
Один раз определяется, две другие координаты могут быть вычислены как
Приведенный выше вывод не уникален. Также можно начать с выражения для и получить выражение для в соответствии с
В идеальном случае, когда камера отображает трехмерные точки в соответствии с идеальной камерой-обскурой, и результирующие двумерные точки могут быть обнаружены без какого-либо шума, два выражения для равны. Однако на практике это не так, и может быть полезно объединить две оценки , например, с точки зрения какой-то средней.
Возможны также другие типы расширений вышеупомянутых вычислений. Они начали с выражения координат изображения со штрихом и вывели трехмерные координаты в системе без штриховки. Также можно начать с координат изображения без штриха и получить трехмерные координаты с штрихами, которые, наконец, можно преобразовать в трехмерные координаты без штриха. Опять же, в идеальном случае результат должен быть равен приведенным выше выражениям, но на практике они могут отличаться.
Последнее замечание касается того факта, что если существенная матрица определяется из соответствующей координаты изображения, что часто имеет место, когда трехмерные точки определяются таким образом, вектор переноса известно только с точностью до неизвестного положительного масштабирования. Как следствие, восстановленные трехмерные точки также не определены в отношении положительного масштабирования.
Оптимальная триангуляция
Этот раздел пуст. Вы можете помочь добавляя к этому. (Ноябрь 2020) |
Смотрите также
Рекомендации
- Ричард Хартли и Эндрю Зиссерман (2003). Многоканальная геометрия в компьютерном зрении. Издательство Кембриджского университета. ISBN 978-0-521-54051-3.
внешняя ссылка
- Два взгляда и многовидовой триангуляция в Matlab