WikiDer > Сумма абсолютных разностей

Sum of absolute differences

В цифровая обработка изображений, то сумма абсолютных разностей (ГРУСТНЫЙ) является мерой сходства между изображениями блоки. Он рассчитывается как абсолютная разница между каждым пиксель в исходном блоке и соответствующий пиксель в блоке, используемом для сравнения. Эти различия суммируются, чтобы создать простую метрику подобия блоков, L1 норма разностного изображения или Манхэттенское расстояние между двумя блоками изображения.

Сумма абсолютных разностей может использоваться для различных целей, например: распознавание объекта, поколение карты несоответствия за стерео изображения и оценка движения за сжатие видео.

Пример

В этом примере сумма абсолютных разностей используется для определения того, какая часть изображения для поиска больше всего похожа на изображение шаблона. В этом примере размер изображения шаблона составляет 3 на 3 пикселя, а размер изображения для поиска - 3 на 5 пикселей. Каждый пиксель представлен одним целое число от 0 до 9.

Шаблон Поиск изображения 2 5 5 2 7 5 8 6 4 0 7 1 7 4 2 7 7 7 5 9 8 4 6 8 5

В поисковом изображении есть ровно три уникальных места, в которые может поместиться шаблон: левая сторона изображения, центр изображения и правая сторона изображения. Для вычисления значений SAD используется абсолютное значение разницы между каждой соответствующей парой пикселей: разница между 2 и 2 равна 0, 4 и 1 равна 3, 7 и 8 равна 1 и так далее.

Вычисление значений абсолютных разностей для каждого пикселя для трех возможных местоположений шаблона дает следующее:

Слева В центре Справа 0 2 0 5 0 3 3 3 13 7 3 3 4 5 0 2 01 1 3 3 1 1 1 3 4

Для каждого из этих трех участков изображения 9 абсолютных разностей складываются вместе, давая значения SAD 20, 25 и 17 соответственно. Исходя из этих значений SAD, можно утверждать, что правая сторона изображения поиска наиболее похожа на изображение шаблона, потому что оно имеет наименьшую сумму абсолютных различий по сравнению с двумя другими местоположениями.

Сравнение с другими показателями

Распознавание объекта

Сумма абсолютных различий обеспечивает простой способ автоматизировать поиск объектов внутри изображения, но может быть ненадежным из-за влияния контекстных факторов, таких как изменения освещения, цвета, направления просмотра, размера или формы. SAD может использоваться вместе с другими методами распознавания объектов, такими как обнаружение края, чтобы повысить надежность результатов.

Сжатие видео

SAD - чрезвычайно быстрая метрика из-за своей простоты; по сути, это простейшая из возможных метрик, учитывающая все пиксель в блоке. Поэтому он очень эффективен для широкого поиска движения по множеству различных блоков. SAD также легко распараллеливаемый поскольку он анализирует каждый пиксель отдельно, что позволяет легко реализовать его с помощью таких инструкций, как ARM NEON или же x86 SSE2. Например, SSE специально для этой цели имеет упакованную инструкцию суммы абсолютных разностей (PSADBW). После того, как блоки-кандидаты найдены, окончательное уточнение процесса оценки движения часто выполняется с помощью других, более медленных, но более точных показателей, которые лучше учитывают человеческое восприятие. К ним относятся сумма абсолютных преобразованных разностей (SATD), сумма квадратов разностей (SSD) и оптимизация скорости-искажения.

Смотрите также

Рекомендации

  • Э. Г. Ричардсон, Иэн (2003). Сжатие видео H.264 и MPEG-4: кодирование видео для мультимедиа следующего поколения. Чичестер: John Wiley & Sons Ltd.