WikiDer > Ускоренные надежные функции - Википедия
Эта статья включает в себя список общих Рекомендации, но он остается в основном непроверенным, потому что ему не хватает соответствующих встроенные цитаты. (Январь 2015) (Узнайте, как и когда удалить этот шаблон сообщения) |
Обнаружение функции |
---|
Обнаружение края |
Обнаружение углов |
Обнаружение капли |
Обнаружение гребня |
Преобразование Хафа |
Структурный тензор |
Обнаружение аффинно-инвариантных признаков |
Описание функции |
Масштабировать пространство |
В компьютерное зрение, ускоренные надежные функции (СЕРФ) является запатентованным местным детектор особенностей и дескриптор. Его можно использовать для таких задач, как распознавание объекта, регистрация изображения, классификация, или же 3D реконструкция. Частично он вдохновлен масштабно-инвариантное преобразование признаков (SIFT) дескриптор. Стандартная версия SURF в несколько раз быстрее, чем SIFT, и, как утверждают ее авторы, более устойчива к различным преобразованиям изображений, чем SIFT.
Для обнаружения точек интереса SURF использует целочисленное приближение определитель гессиана детектор капель, который может быть вычислен с помощью 3 целочисленных операций с использованием предварительно вычисленного целостный образ. Его дескриптор функции основан на сумме Вейвлет Хаара ответ вокруг интересующей точки. Их также можно вычислить с помощью интегрального изображения.
Дескрипторы SURF использовались для поиска и распознавания объектов, людей или лиц, для реконструкции трехмерных сцен, для отслеживания объектов и для извлечения достопримечательностей.
SURF был впервые опубликован Герберт Бэй, Tinne Tuytelaars и Luc Van Gool, представленные на выставке 2006 г. Европейская конференция по компьютерному зрению. Применение алгоритма запатентовано в США.[1] «Вертикальная» версия SURF (называемая U-SURF) не инвариантна к вращению изображения и, следовательно, быстрее вычисляется и лучше подходит для приложений, где камера остается более или менее горизонтальной.
Изображение преобразуется в координаты с помощью пирамидальная техника с несколькими разрешениями, чтобы скопировать исходное изображение с пирамидальным гауссовым или Лапласианская пирамида shape для получения изображения того же размера, но с меньшей пропускной способностью. Таким образом достигается особый эффект размытия исходного изображения, называемый «Масштаб-пространство», и гарантируется, что интересующие точки не изменятся в масштабе.
Алгоритм и особенности
Алгоритм SURF основан на тех же принципах и шагах, что и SIFT; но детали на каждом этапе разные. Алгоритм состоит из трех основных частей: обнаружение точек интереса, описание местного района и сопоставление.
Обнаружение
SURF использует квадратные фильтры как приближение Гауссово сглаживание. (Подход SIFT использует каскадные фильтры для обнаружения масштабно-инвариантных характеристических точек, где разность гауссианов (DoG) вычисляется для масштабированных изображений постепенно.) Фильтрация изображения с квадратом выполняется намного быстрее, если целостный образ используется:
Сумму исходного изображения внутри прямоугольника можно быстро оценить с помощью интегрального изображения, что потребует оценки в четырех углах прямоугольника.
SURF использует детектор капель на основе Матрица Гессе чтобы найти достопримечательности. В детерминант матрицы Гессе используется как мера локального изменения вокруг точки, и выбираются точки, в которых этот определитель максимален. В отличие от детектора Гессе-Лапласа Миколайчика и Шмида, SURF также использует детерминант Гессе для выбора масштаба, как это также сделал Линдеберг. Для точки p = (x, y) на изображении I матрица Гессе H (p, σ) в точке p и масштабе σ равна:
куда и т. д. - свертка второй производной гауссиана с изображением в момент .
Ящичный фильтр размером 9 × 9 представляет собой аппроксимацию гауссиана с σ = 1,2 и представляет самый низкий уровень (самое высокое пространственное разрешение) для карт отклика blob.
Масштабно-пространственное представление и расположение достопримечательностей
Интересные моменты можно найти в разных масштабах, отчасти потому, что для поиска соответствий часто требуются сравнительные изображения, на которых они видны в разных масштабах. В других алгоритмах обнаружения признаков масштабное пространство обычно реализуется в виде пирамиды изображений. Изображения многократно сглаживаются с помощью фильтра Гаусса, затем они подвергаются субдискретизации, чтобы получить следующий более высокий уровень пирамиды. Поэтому рассчитывается несколько этажей или лестниц с различными размерами масок:
Пространство шкалы разделено на несколько октав, где октава относится к серии карт отклика, покрывающих удвоение шкалы. В SURF самый низкий уровень масштабного пространства получается на выходе фильтров 9 × 9.
Следовательно, в отличие от предыдущих методов, масштабные пространства в SURF реализуются путем применения прямоугольных фильтров разных размеров. Соответственно, масштабное пространство анализируется путем увеличения размера фильтра, а не итеративного уменьшения размера изображения. Результат вышеупомянутого фильтра 9 × 9 рассматривается как начальный масштабный слой в масштабе s = 1,2 (соответствует гауссовским производным с σ = 1,2). Следующие слои получаются путем фильтрации изображения с постепенно увеличивающимися масками, принимая во внимание дискретный характер целостных изображений и особую структуру фильтра. В результате получаются фильтры размером 9 × 9, 15 × 15, 21 × 21, 27 × 27, .... Для локализации точек интереса на изображении и в больших масштабах применяется не максимальное подавление в окрестности 3 × 3 × 3. . Максимумы определителя матрицы Гессе затем интерполируются в масштабе и пространстве изображения с помощью метода, предложенного Брауном и др. Интерполяция шкалы в пространстве особенно важна в этом случае, поскольку разница в шкале между первыми слоями каждой октавы относительно велика.
Дескриптор
Цель дескриптора - предоставить уникальное и надежное описание изображения. особенность, например, описывая распределение интенсивности пикселей в окрестности интересующей точки. Таким образом, большинство дескрипторов вычисляются локально, следовательно, описание получается для каждой точки интереса, определенной ранее.
Размерность дескриптора напрямую влияет как на его вычислительную сложность, так и на надежность / точность сопоставления точек. Короткий дескриптор может быть более устойчивым к вариациям внешнего вида, но может не обеспечивать достаточной дискриминации и, таким образом, давать слишком много ложных срабатываний.
Первый шаг состоит в фиксации воспроизводимой ориентации на основе информации из круговой области вокруг интересующей точки. Затем мы создаем квадратную область, выровненную по выбранной ориентации, и извлекаем из нее дескриптор SURF.
Назначение ориентации
Чтобы добиться инвариантности вращения, необходимо определить ориентацию интересующей точки. Отклики вейвлета Хаара как в x-, так и в y-направлениях в круговой окрестности радиуса вокруг интересующей точки вычисляются, где - масштаб, в котором объект интереса был обнаружен. Полученные ответы взвешиваются с помощью функции Гаусса с центром в интересующей точке, затем отображаются в виде точек в двумерном пространстве с горизонтальным откликом в абсцисса и вертикальный отклик в ордината. Доминирующая ориентация оценивается путем вычисления суммы всех ответов в пределах скользящего окна ориентации размером π / 3. Суммируются горизонтальные и вертикальные отклики внутри окна. Затем два суммированных ответа дают вектор локальной ориентации. Самый длинный такой вектор в целом определяет ориентацию интересующей точки. Размер скользящего окна - это параметр, который необходимо тщательно выбирать для достижения желаемого баланса между надежностью и угловым разрешением.
Дескриптор на основе суммы откликов вейвлета Хаара
Чтобы описать область вокруг точки, извлекается квадратная область, центрируется на точке интереса и ориентируется по ориентации, как указано выше. Размер этого окна - 20 сек.
Область интереса разделена на более мелкие квадратные подобласти 4x4, и для каждой из них вейвлет-отклики Хаара извлекаются в точках выборки 5x5 с регулярным интервалом. Отклики взвешиваются с помощью гауссиана (чтобы обеспечить большую устойчивость к деформациям, шуму и перемещению).
Соответствие
Сравнивая дескрипторы, полученные из разных изображений, можно найти совпадающие пары.
Смотрите также
- Масштабно-инвариантное преобразование признаков (ПРОСЕЯТЬ)
- Гистограмма расположения и ориентации градиента
- Гистограмма формы на основе локальной энергии (LESH)
- Обнаружение капли
- Обнаружение функций (компьютерное зрение)
Рекомендации
- ^ США 2009238460, Рюдзи Фунаяма, Хиромити Янагихара, Люк Ван Гул, Тинне Туйтелаарс, Герберт Бэй, "НАДЕЖНЫЙ ДЕТЕКТОР И ОПИСАНИЕ ИНТЕРЕСНОЙ ТОЧКИ", опубликовано 24 сентября 2009 г.
Источники
- Герберт Бэй, Андреас Эсс, Тинне Тайтелаарс и Люк Ван Гул "Ускоренные надежные функции", ETH Zurich, Katholieke Universiteit Leuven
- Андреа Марисела Плаза Кордеро, Хорхе Луис Самбрано Мартинес " Estudio y Selección de las Técnicas SIFT, SURF y ASIFT de Reconocimiento de Imágenes para el Diseño de un Prototipo en Dispositivos Móviles", 15º Concurso de Trabajos Estudiantiles, EST 2012
- А. М. Ромеро и М. Касорла "Comparativa de detectores de característicasvisuales y su aplicación al SLAM ", X Workshop de Agenttes físicos, Setiembre 2009, Касерес
- П. М. Панчал, С. Р. Панчал, С. К. Шах "Сравнение SIFT и SURF ", Международный журнал инновационных исследований в области вычислительной техники и коммуникаций, том 1, выпуск 2, апрель 2013 г.
- Герберт Бэй, Андреас Эсс, Тинне Туйтелаарс, Люк Ван Гул "SURF: Ускоренные надежные функции", Компьютерное зрение и понимание изображений (CVIU), Vol. 2008, 110, № 3, с. 346–359.
- Кристофер Эванс «Заметки о библиотеке OpenSURF», магистр компьютерных наук, Бристольский университет; исходный код и документация заархивированы здесь
- Джан Кнопп, Мукта Прасад, Герт Виллемс, Раду Тимофте и Люк Ван Гул "Преобразование Хафа и 3D SURF для надежной трехмерной классификации", Европейская конференция по компьютерному зрению (ECCV), 2010 г.