WikiDer > Преобразование Хафа - Википедия

Hough transform - Wikipedia

В Преобразование Хафа это извлечение признаков техника, используемая в анализ изображений, компьютерное зрение, и цифровая обработка изображений.[1] Цель метода - найти несовершенные экземпляры объектов в определенном классе форм с помощью процедуры голосования. Эта процедура голосования проводится в пространство параметров, из которых объекты-кандидаты получаются в виде локальных максимумов в так называемом аккумуляторном пространстве, которое явно создается алгоритмом вычисления преобразования Хафа.

Классическое преобразование Хафа касалось идентификации линии на изображении, но позже преобразование Хафа было расширено для определения положений произвольных форм, чаще всего круги или же эллипсы. Преобразование Хафа, повсеместно используемое сегодня, было изобретено Ричард Дуда и Питер Харт в 1972 году, который назвал это «обобщенным преобразованием Хафа»[2] после соответствующего патента 1962 года Пола Хоу.[3][4] Преобразование было популяризировано в компьютерное зрение сообщество Дана Х. Баллард в журнальной статье 1981 г., озаглавленной "Обобщение преобразования Хафа для обнаружения произвольных форм".

История

Первоначально он был изобретен для машинного анализа пузырьковая камера фотографии (Hough, 1959).

Преобразование Хафа было запатентовано как Патент США 3069654 в 1962 году и передан Комиссии по атомной энергии США под названием «Метод и средства распознавания сложных закономерностей». В этом патенте используется параметризация угла наклона для прямых линий, что неудобно приводит к неограниченному пространству преобразования, поскольку наклон может уходить в бесконечность.

Ротета-параметризация, широко используемая сегодня, была впервые описана в

Duda, R.O .; Харт, П. Э. (январь 1972 г.). «Использование преобразования Хафа для обнаружения линий и кривых на изображениях» (PDF). Comm. ACM. 15: 11–15. Дои:10.1145/361237.361242.

хотя это уже было стандартно для Преобразование радона по крайней мере с 1930-х гг.

Вариация О'Гормана и Клоуза описана в

О'Горман, Фрэнк; Клоуз, МБ (1976). «Поиск краев изображения посредством коллинеарности характерных точек». IEEE Trans. Вычислить. 25 (4): 449–456. Дои:10.1109 / TC.1976.1674627.

История изобретения современной формы преобразования Хафа приведена в

Харт, П. Э. (ноябрь 2009 г.). «Как было изобретено преобразование Хафа» (PDF). Журнал IEEE Signal Processing Magazine. 26 (6): 18–22. Дои:10.1109 / msp.2009.934181.

Теория

В автоматизированном анализе цифровые изображениячасто возникает подзадача при обнаружении простых форм, таких как прямые линии, круги или эллипсы. Во многих случаях детектор края может использоваться как этап предварительной обработки для получения точек изображения или пикселей изображения, которые находятся на желаемой кривой в пространстве изображения. Однако из-за несовершенства данных изображения или детектора краев на требуемых кривых могут быть отсутствующие точки или пиксели, а также пространственные отклонения между идеальной линией / кругом / эллипсом и точками края с шумом, поскольку они получены из детектор края. По этим причинам часто нетривиально сгруппировать извлеченные элементы ребер в соответствующий набор линий, окружностей или эллипсов. Цель преобразования Хафа - решить эту проблему, сделав возможным группирование краевых точек в объекты-кандидаты, выполнив явную процедуру голосования по набору параметризованных объектов изображения (Shapiro and Stockman, 304).

Простейший случай преобразования Хафа - обнаружение прямых линий. В общем прямая у = mx + b можно представить в виде точки (б, м) в пространстве параметров. Однако вертикальные линии создают проблему. Они привели бы к неограниченным значениям параметра наклона м. Таким образом, по вычислительным причинам Дуда и Харт[5] предложил использовать Нормальная форма Гессена

,

куда это расстояние от источник до ближайшей точки на прямой, и (тета) - угол между ось и линия, соединяющая начало координат с ближайшей точкой.

R theta line.GIF

Следовательно, можно связать с каждой строкой изображения пару . В самолет иногда называют Hough space для набора прямых в двух измерениях. Такое представление делает преобразование Хафа концептуально очень близким к двумерному Преобразование радона. Фактически, преобразование Хафа математически эквивалентно преобразованию Радона, но эти два преобразования имеют разные вычислительные интерпретации, традиционно связанные с ними.[6]

Учитывая единственная точка в самолете, то набор все прямые линии, проходящие через эту точку, соответствуют синусоидальный кривая в (г, θ) плоскости, которая уникальна для этой точки. Набор из двух или более точек, образующих прямую линию, даст синусоиды, которые пересекаются в (г, θ) для этой строки. Таким образом, проблема обнаружения коллинеарные точки можно превратить в задачу поиска одновременный кривые.[7]

Выполнение

Линейное преобразование Хафа алгоритм использует двумерный массив, называемый аккумулятором, для обнаружения существования строки, описываемой . В измерение аккумулятора равно количеству неизвестных параметров, то есть двум, учитывая квантованные значения r и θ в паре (r, θ). Для каждого пикселя в (х, у) и его окрестности алгоритм преобразования Хафа определяет, достаточно ли доказательств наличия прямой линии в этом пикселе. Если это так, он будет вычислять параметры (r, θ) этой строки, а затем искать ячейку аккумулятора, в которую попадают параметры, и увеличивать значение этой ячейки. Находя ячейки с самыми высокими значениями, обычно путем поиска для локальных максимумов в пространстве аккумулятора можно выделить наиболее вероятные линии и считать их (приблизительные) геометрические определения. (Шапиро и Стокман, 304) Самый простой способ найти эти вершины заключается в применении некоторой формы порога, но другие методы могут дать лучшие результаты в различных обстоятельствах - определение того, какие линии и сколько обнаружены. Поскольку возвращаемые строки не содержат информации о длине, на следующем шаге часто необходимо найти, какие части изображения совпадают с какими строками. Более того, из-за ошибок несовершенства на этапе обнаружения края обычно будут ошибки в накопительном пространстве, что может сделать нетривиальным поиск соответствующих пиков и, следовательно, соответствующих линий.

Конечным результатом линейного преобразования Хафа является двумерный массив (матрица), подобный аккумулятору: одно измерение этой матрицы - это квантованный угол θ, а другое измерение - квантованное расстояние r. Каждый элемент матрицы имеет значение, равное сумме точек или пикселей, которые расположены на строке, представленной квантованными параметрами (r, θ). Таким образом, элемент с самым высоким значением указывает прямую линию, которая больше всего представлена ​​на входном изображении.[8]

Примеры

Пример 1

Рассмотрим три точки данных, показанные здесь черными точками.

Три графика, показывающие этапы процесса преобразования Хафа
  • Для каждой точки данных нанесено несколько линий, проходящих через нее, все под разными углами. Они показаны здесь разными цветами.
  • Для каждой линии существует линия поддержки, которая перпендикуляр к нему и который пересекает источник. В каждом случае один из них показан стрелкой.
  • Длина (т.е. перпендикулярна расстояние до начала координат) и угол каждой опорной линии вычисляются. Длины и углы указаны в таблицах под диаграммами.

Из расчетов видно, что в любом случае линия поддержки под углом 60 ° имеет одинаковую длину. Следовательно, понятно, что соответствующие линии (синие на рисунке выше) очень похожи. Таким образом, можно предположить, что все точки лежат близко к синей линии.

Пример 2

Ниже приведен другой пример, показывающий результаты преобразования Хафа для растрового изображения, содержащего две толстые линии.

Hough-example-result-en.png

Результаты этого преобразования были сохранены в матрице. Значение ячейки представляет собой количество кривых через любую точку. Более высокие значения ячеек отображаются ярче. Два отчетливо ярких пятна - это параметры Хафа двух линий. По положению этих пятен можно определить угол и расстояние от центра изображения двух линий входного изображения.

Варианты и расширения

Использование направления градиента для уменьшения количества голосов

Усовершенствование, предложенное О'Горманом и Клоузом, может быть использовано для обнаружения линий, если принять во внимание, что местный градиент интенсивности изображения обязательно будет перпендикулярно краю. С обнаружение края обычно включает в себя вычисление интенсивности градиент величина, направление градиента часто встречается как побочный эффект. Если заданная точка координат (х, у) действительно находится на линии, тогда локальное направление градиента дает θ параметр, соответствующий указанной строке, и р параметр сразу же получается. (Шапиро и Стокман, 305). Направление градиента можно оценить с точностью до 20 °, что укорачивает синусоидальный след от полных 180 ° до примерно 45 °. Это сокращает время вычислений и имеет интересный эффект уменьшения количества бесполезных голосов, тем самым улучшая видимость всплесков, соответствующих реальным линиям на изображении.

Преобразование Хафа на основе ядра (KHT)

Фернандес и Оливейра [9] предложил улучшенную схему голосования для преобразования Хафа, которая позволяет программной реализации достичь производительности в реальном времени даже на относительно больших изображениях (например, 1280 × 960). Преобразование Хафа на основе ядра использует то же параметризация, предложенная Дудой и Хартом, но работает с кластерами приблизительно коллинеарных пикселей. Для каждого кластера голоса подаются с использованием ориентированного эллиптического гауссова ядра, которое моделирует неопределенность, связанную с линией наилучшего соответствия по отношению к соответствующему кластеру. Такой подход не только значительно улучшает производительность схемы голосования, но также обеспечивает более чистый аккумулятор и делает преобразование более устойчивым к обнаружению ложных линий.

Трехмерное преобразование Хафа на основе ядра для обнаружения плоскости (3DKHT)

Лимбергер и Оливейра [10] предложил детерминированный метод обнаружения самолетов в неорганизованных облаках точек, стоимость которого составляет в количестве выборок, достигая производительности в реальном времени для относительно больших наборов данных (до очков на процессоре 3,4 ГГц). Он основан на стратегии быстрого голосования с преобразованием Хафа для плоских областей, вдохновленной преобразованием Хафа на основе ядра (KHT). Это преобразование Хафа на основе трехмерного ядра (3DKHT) использует быстрый и надежный алгоритм для сегментации кластеров приблизительно копланарных образцов и отбрасывает голоса за отдельные кластеры (а не за отдельные образцы) на () сферический аккумулятор, использующий гауссовское ядро ​​трех величин. Этот подход на несколько порядков быстрее, чем существующие (недетерминированные) методы обнаружения плоскости в облаках точек, такие как RHT и RANSAC, и лучше масштабируется с размером наборов данных. Его можно использовать с любым приложением, которое требует быстрого обнаружения плоских объектов в больших наборах данных.

Преобразование Хафа кривых и его обобщение для аналитических и неаналитических форм

Хотя описанная выше версия преобразования применяется только к поиску прямых линий, аналогичное преобразование может использоваться для поиска любой формы, которая может быть представлена ​​набором параметров. Например, круг можно преобразовать в набор из трех параметров, представляющих его центр и радиус, так что пространство Хафа станет трехмерным. Таким же образом можно найти произвольные эллипсы и кривые, а также любую форму, которую легко выразить как набор параметров.

Обобщение преобразования Хафа для обнаружения аналитических форм в пространствах любой размерности было предложено Фернандесом и Оливейрой.[11] В отличие от других подходов, основанных на преобразовании Хафа для аналитических форм, метод Фернандеса не зависит ни от формы, которую нужно обнаружить, ни от типа входных данных. Обнаружение может быть преобразовано в тип аналитической формы путем изменения предполагаемой модели геометрии, в которой данные были закодированы (например, евклидово пространство, проективное пространство, конформная геометрияи т. д.), а предлагаемая формулировка остается неизменной. Кроме того, он гарантирует, что намеченные формы представлены с наименьшим возможным количеством параметров, и позволяет одновременно обнаруживать различные виды фигур, которые лучше всего подходят для входного набора записей с разными размерностями и разными геометрическими определениями (например, одновременное обнаружение плоскостей и сфер, которые лучше всего подходят для набора точек, прямых и окружностей).

Для более сложных форм на плоскости (т. Е. Фигур, которые невозможно представить аналитически в некотором 2D-пространстве), Обобщенное преобразование Хафа [12] используется, что позволяет функции голосовать за конкретное положение, ориентацию и / или масштабирование формы с использованием предварительно определенной справочной таблицы.

Процесс обнаружения круга

Изменить алгоритм для обнаружения круглых форм вместо линий относительно просто.

  • Во-первых, мы создаем пространство аккумулятора, которое состоит из ячейки для каждого пикселя. Первоначально для каждой ячейки установлено значение 0.
  • Для каждой граничной точки (i, j) на изображении увеличьте все ячейки, которые в соответствии с уравнением круга может быть центром круга. Эти ячейки обозначены буквой в уравнении.
  • Для каждого возможного значения найденные на предыдущем шаге, найдите все возможные значения которые удовлетворяют уравнению.
  • Поиск локальных максимумов в аккумуляторном пространстве. Эти ячейки представляют собой кружки, обнаруженные алгоритмом.

Если мы не знаем радиус круга, который пытаемся определить заранее, мы можем использовать трехмерное пространство-накопитель для поиска кругов с произвольным радиусом. Естественно, это более затратно в вычислительном отношении.

Этот метод также может обнаруживать круги, которые частично находятся за пределами области аккумулятора, если в нем все еще присутствует достаточная часть площади круга.

Обнаружение 3D-объектов (плоскостей и цилиндров)

Преобразование Хафа также можно использовать для обнаружения 3D-объектов в данных дальности или 3D облака точек. Расширение классического преобразования Хафа для обнаружения плоскости довольно просто. Самолет представлен своим явным уравнением для которого мы можем использовать трехмерное пространство Хафа, соответствующее , и . Это расширение страдает теми же проблемами, что и его двумерный аналог, то есть почти горизонтальные плоскости могут быть надежно обнаружены, в то время как производительность ухудшается, когда плоское направление становится вертикальным (большие значения и усилить шум в данных). Эта постановка самолета использовалась для обнаружения самолетов в облака точек получено с помощью лазерного сканирования с воздуха [13] и работает очень хорошо, потому что в этой области все плоскости почти горизонтальны.

Для обнаружения обобщенной плоскости с использованием преобразования Хафа плоскость может быть параметризована ее нормальным вектором. (с использованием сферических координат) и его расстояние от начала координат в результате получается трехмерное пространство Хафа. Это приводит к тому, что каждая точка входных данных голосует за синусоидальную поверхность в пространстве Хафа. Пересечение этих синусоидальных поверхностей указывает на наличие плоскости.[14] Более общий подход для более чем трех измерений требует, чтобы эвристика поиска оставалась возможной.[15]

Преобразование Хафа также использовалось для поиска цилиндрических объектов в облака точек используя двухэтапный подход. Первый шаг находит ориентацию цилиндра, а второй шаг находит положение и радиус.[16]

Использование взвешенных функций

Одна общая деталь вариации. То есть, поиск интервалов с наибольшим счетчиком на одном этапе можно использовать для ограничения диапазона значений, поиск которых выполняется на следующем этапе.

Тщательно подобранное пространство параметров

Пространство параметров высокой размерности для преобразования Хафа не только медленное, но и, если оно реализовано без предусмотрительности, может легко переполнить доступную память. Даже если среда программирования позволяет выделять массив, превышающий доступное пространство памяти, через виртуальную память, количество требуемых для этого подкачки страниц будет очень требовательным, поскольку накопительный массив используется случайным образом, редко останавливаясь в непрерывной памяти. при переходе от индекса к индексу.

Рассмотрим задачу поиска эллипсов на изображении 800x600. Если предположить, что радиусы эллипсов ориентированы вдоль главных осей, пространство параметров будет четырехмерным. (x, y) определяет центр эллипса, а a и b обозначают два радиуса. Разрешение центру быть в любом месте изображения, добавляет ограничение 0

Созданной таким образом программе вряд ли будет позволено выделить достаточно памяти. Это не означает, что проблема не может быть решена, а только то, что необходимо найти новые способы ограничения размера массива аккумуляторов, что делает это возможным. Например:

  1. Если разумно предположить, что каждый из эллипсов полностью содержится в изображении, диапазон радиусов можно уменьшить. Наибольший радиус может быть, если центр эллипса находится в центре изображения, позволяя краям эллипса растягиваться до краев. В этом крайнем случае каждый радиус может быть только половиной размера изображения, ориентированного в одном направлении. Уменьшение диапазона a и b таким образом уменьшает массив аккумуляторов до 57 миллиардов значений.
  2. Точность обмена на пространство при оценке центра: если прогнозируется отклонение центра на 3 по осям x и y, это уменьшает размер массива аккумуляторов примерно до 6 миллиардов значений.
  3. Точность обмена на пространство при оценке радиусов: если каждый радиус оценивается как отклонение на 5, происходит дальнейшее уменьшение размера массива аккумуляторов примерно на 256 миллионов значений.
  4. Обрежьте изображение по интересующим областям. Это зависит от изображения и, следовательно, непредсказуемо, но представьте себе случай, когда все интересующие края изображения находятся в верхнем левом квадранте этого изображения. В этом случае массив аккумуляторов можно уменьшить еще больше, ограничив все 4 параметра коэффициентом 2, что дает общий коэффициент уменьшения 16.

Применяя только первые три из этих ограничений к указанному примеру, размер массива аккумуляторов уменьшается почти в 1000 раз, уменьшая его до размера, который с большей вероятностью уместится в памяти современного компьютера.

Эффективный алгоритм обнаружения эллипсов

Юнхун Се и Цян Цзи предлагают эффективный способ реализации преобразования Хафа для обнаружения эллипсов, преодолевая проблемы с памятью.[17] Как обсуждалось в алгоритме (на странице 2 документа), этот подход использует только одномерный аккумулятор (для малой оси) для обнаружения эллипсов на изображении. Сложность O (N3) в количестве ненулевых точек на изображении.

Ограничения

Преобразование Хафа эффективно только в том случае, если в правую ячейку попадает большое количество голосов, так что ячейку можно легко обнаружить среди фонового шума. Это означает, что корзина не должна быть слишком маленькой, иначе часть голосов упадет в соседние ячейки, что уменьшит видимость основной корзины.[18]

Кроме того, когда количество параметров велико (то есть, когда мы используем преобразование Хафа, как правило, с более чем тремя параметрами), среднее количество голосов, поданных в одной ячейке, очень мало, и эти ячейки соответствуют реальной цифре. на изображении не обязательно имеют гораздо большее количество голосов, чем их соседи. Сложность увеличивается со скоростью с каждым дополнительным параметром, где размер пространства изображения и - количество параметров. (Шапиро и Стокман, 310) Таким образом, преобразование Хафа необходимо использовать с большой осторожностью, чтобы обнаружить что-либо, кроме линий или окружностей.

Наконец, большая часть эффективности преобразования Хафа зависит от качества входных данных: края должны быть хорошо обнаружены, чтобы преобразование Хафа было эффективным. Использование преобразования Хафа на зашумленных изображениях - очень деликатный вопрос, и, как правило, прежде необходимо использовать этап шумоподавления. В случае искажения изображения из-за спеклов, как в случае с радиолокационными изображениями, Преобразование радона иногда предпочтительнее обнаруживать линии, поскольку он ослабляет шум посредством суммирования.

Смотрите также

Рекомендации

  1. ^ Шапиро, Линда и Стокман, Джордж. "Компьютерное зрение", Prentice-Hall, Inc. 2001
  2. ^ Дуда, Р. О. и П. Э. Харт, "Использование преобразования Хафа для обнаружения линий и кривых на изображениях", Comm. ACM, Vol. 15, стр. 11–15 (январь 1972 г.)
  3. ^ Hough, P.V.C. Метод и средства распознавания сложных образов, Патент США 3069654, 18 декабря 1962 г.
  4. ^ P.V.C. Ха, Машинный анализ изображений пузырьковой камеры, Proc. Int. Конф. Ускорители и приборы высоких энергий, 1959 г.
  5. ^ Ричард О. Дуда и Питер Э. Харт (Апрель 1971 г.). «Использование преобразования Хафа для обнаружения линий и кривых на изображениях» (PDF). Центр Искусственного Интеллекта.CS1 maint: использует параметр авторов (связь)
  6. ^ CiteSeerX - краткое введение в преобразования Радона и Хафа и их связь друг с другом.
  7. ^ «Преобразование Хафа».
  8. ^ Дженсен, Джепп. «Преобразование Хафа для прямых» (PDF). Архивировано из оригинал (PDF) 26 апреля 2012 г.. Получено 16 декабря 2011.
  9. ^ Fernandes, L.A.F .; Оливейра, М. (2008). «Обнаружение линий в реальном времени с помощью улучшенной схемы голосования с преобразованием Хафа». Распознавание образов. 41 (1): 299–314. Дои:10.1016 / j.patcog.2007.04.003.
  10. ^ Limberger, F.A .; Оливейра, М. (2015). «Обнаружение плоских областей в неорганизованных облаках точек в реальном времени» (PDF). Распознавание образов. 48 (6): 2043–2053. Дои:10.1016 / j.patcog.2014.12.020. HDL:10183/97001.
  11. ^ Fernandes, L.A.F .; Оливейра, М. (2012). «Общая основа для обнаружения подпространства в неупорядоченных многомерных данных». Распознавание образов. 45 (9): 3566–3579. Дои:10.1016 / j.patcog.2012.02.033.
  12. ^ Баллард, Д. Х. (1981). «Обобщение преобразования Хафа для обнаружения произвольных форм». Распознавание образов. 13 (2): 111–122. Дои:10.1016/0031-3203(81)90009-1. HDL:1802/13802.
  13. ^ Фоссельман, Г., Дейкман, С: "Реконструкция 3D-модели здания из облаков точек и планов местности", Международный архив фотограмметрии, дистанционного зондирования и пространственной информации, том 34, часть 3 / W4, 22–24 октября 2001 г., Аннаполис, Массачусетс, США, стр. 37–44.
  14. ^ Тахир Раббани: «Автоматическая реконструкция промышленных установок - Использование облаков точек и изображений», стр. 43-44, Публикации по геодезии 62, Делфт, 2006. ISBN 978-90-6132-297-9 http://www.ncg.knaw.nl/Publicaties/Geodesy/62Rabbani.html
  15. ^ Ахтерт, Эльке; Бём, Кристиан; Дэвид, Йорн; Крегер, Пер; Зимек, Артур (2008). «Глобальная корреляционная кластеризация на основе преобразования Хафа». Статистический анализ и интеллектуальный анализ данных. 1 (3): 111–127. Дои:10.1002 / sam.10012.
  16. ^ Тахир Раббани и Франк ван ден Хеувел "Эффективное преобразование Хафа для автоматического обнаружения цилиндров в облаках точек"в материалах 11-й ежегодной конференции Высшей школы вычислительной техники и обработки изображений (ASCI '05), Нидерланды, июнь 2005 г.
  17. ^ Юнхун Се; Цян Цзи (2002). «Новый эффективный метод обнаружения эллипсов». Распознавание объектов при взаимодействии с пользователем для сервисных роботов. 2. С. 957–960. CiteSeerX 10.1.1.1.8792. Дои:10.1109 / ICPR.2002.1048464. ISBN 978-0-7695-1695-0.
  18. ^ «Преобразование изображений - преобразование Хафа». Homepages.inf.ed.ac.uk. Получено 2009-08-17.

внешняя ссылка