WikiDer > Хаароподобная особенность

Haar-like feature

Хаара-подобные особенности находятся цифровое изображение Особенности используется в распознавание объекта. Своим названием они обязаны интуитивному сходству с Вейвлеты Хаара и использовались в первом детекторе лиц в реальном времени.[1]

Исторически сложилось так, что работа только с яркостью изображения (т.е. RGB пиксель значения в каждом пикселе изображения) сделали задачу расчета признаков вычислительно дорогой. В публикации Papageorgiou et al.[2] обсудили работу с альтернативным набором функций, основанным на вейвлетах Хаара вместо обычной интенсивности изображения. Пол Виола и Майкл Джонс[1] адаптировали идею использования вейвлетов Хаара и разработали так называемые особенности Хаара. Функция, подобная Хаару, рассматривает соседние прямоугольные области в определенном месте в окне обнаружения, суммирует интенсивности пикселей в каждой области и вычисляет разницу между этими суммами. Затем эта разница используется для категоризировать Например, для человеческого лица часто наблюдается, что у всех лиц область глаз темнее, чем область щек. Таким образом, обычная функция Хаара для распознавания лиц - это набор из двух смежных прямоугольников, расположенных над глазом и в области щек. Положение этих прямоугольников определяется относительно окна обнаружения, которое действует как ограничивающая рамка для целевого объекта (в данном случае лица).

На этапе обнаружения Среда обнаружения объектов Виолы – Джонса, окно целевого размера перемещается по входному изображению, и для каждой части изображения вычисляется характеристика Хаара. Затем это различие сравнивается с полученным порогом, который отделяет не-объекты от объектов. Поскольку такая характеристика Хаара является лишь слабым учеником или классификатором (ее качество обнаружения немного лучше, чем случайное предположение), для описания объекта с достаточной точностью необходимо большое количество функций, подобных Хаару. Таким образом, в структуре обнаружения объектов Виолы – Джонса функции, подобные Хаару, организованы в нечто, называемое каскад классификаторов сформировать сильного ученика или классификатора.

Ключевым преимуществом функции, подобной Хаару, перед большинством других функций является ее скорость вычислений. За счет использования интегральные образы, объект типа Хаара любого размера может быть вычислен за постоянное время (примерно 60 инструкций микропроцессора для объекта с двумя прямоугольниками).

Прямоугольные детали типа Хаара

Простая прямоугольная функция типа Хаара может быть определена как разница суммы пикселей областей внутри прямоугольника, которая может находиться в любом положении и в любом масштабе в пределах исходного изображения. Этот измененный набор функций называется 2-прямоугольный элемент. Виола и Джонс также определили 3-прямоугольные и 4-прямоугольные элементы. Значения указывают на определенные характеристики определенной области изображения. Каждый тип элемента может указывать на наличие (или отсутствие) определенных характеристик в изображении, таких как края или изменения текстуры. Например, объект с двумя прямоугольниками может указывать, где проходит граница между темной и светлой областью.

Быстрое вычисление характеристик типа Хаара

Одним из вкладов Виолы и Джонса было использование таблицы суммированных площадей,[3] который они назвали интегральные образы. Интегральные изображения можно определить как двумерные. таблицы поиска в виде матрицы с таким же размером исходного изображения. Каждый элемент целостного изображения содержит сумму всех пикселей, расположенных в верхнем левом углу исходного изображения (относительно положения элемента). Это позволяет вычислить сумму прямоугольных областей изображения в любом положении и в любом масштабе, используя всего четыре поиска:

Нахождение суммы заштрихованной прямоугольной области

где точки принадлежат целостному образу , как показано на рисунке.

Для каждой функции, подобной Хаару, может потребоваться более четырех поисков, в зависимости от того, как она была определена. Для 2-прямоугольных функций Виолы и Джонса требуется шесть поисков, для 3-прямоугольных функций требуется восемь поисков, а для 4-прямоугольных функций требуется девять поисков.

Наклонные характерные черты Хаара

Линхарт и Мейдт[4] представила концепцию наклонного (45 °) элемента типа Хаара. Это использовалось для увеличения размерность набора функций в попытке улучшить обнаружение объектов на изображениях. Это было успешным, так как некоторые из этих функций могут лучше описать объект. Например, двухпрямоугольный наклонный элемент типа Хаара может указывать на наличие кромки под углом 45 °.

Мессом и Барчак[5] расширил идею до универсального повернутого элемента типа Хаара. Хотя идея математически обоснована, практические проблемы не позволяют использовать свойства Хаара под любым углом. Чтобы быть быстрыми, алгоритмы обнаружения используют изображения с низким разрешением. ошибки округления. По этой причине поворотные элементы типа Хаара обычно не используются.

Рекомендации

  1. ^ а б Виола и Джонс "Быстрое обнаружение объектов с помощью усиленного каскада простых функций", Компьютер Cool Vision и Распознавание образов, 2001
  2. ^ Папагеоргиу, Орен и Поджио, «Общая структура для обнаружения объектов», Международная конференция по компьютерному зрению, 1998 г.
  3. ^ Ворона, F, "Таблицы суммированных площадей для наложения текстуры", в Трудах СИГГРАФ, 18(3):207–212, 1984
  4. ^ Линхарт Р. и Мейдт Дж. "Расширенный набор функций типа Хаара для быстрого обнаружения объектов", ICIP02, стр. I: 900–903, 2002
  5. ^ Мессом, К. и Барчак, A.L.C. "Быстрые и эффективные поворотные элементы типа Хаара с использованием повернутых интегральных изображений", Австралийская конференция по робототехнике и автоматизации (ACRA2006), стр. 1–6, 2006 г.