WikiDer > Простое интерактивное извлечение объектов
Простое интерактивное извлечение объектов (SIOX) - это алгоритм извлечения объектов переднего плана из цветных изображений и видео с минимальным взаимодействием с пользователем.[1] Он был реализован как инструмент «выделение переднего плана» в GIMP (начиная с версии 2.3.3), как часть инструмента трассировки в Inkscape (начиная с 0.44pre3), и как функция в ImageJ и Фиджи (плагин). Также сообщалось об экспериментальных реализациях Блендер и Крита. Хотя алгоритм изначально был разработан для видео, практически все реализации используют SIOX в первую очередь для сегментации неподвижных изображений. На самом деле, это часто называют текущим стандарт де-факто для этой задачи в Открытый исходный код Мир.
Первоначально для указания интересующей области используется инструмент произвольного выбора. Он должен содержать все объекты переднего плана для извлечения и как можно меньше фона. Пиксели за пределами интересующей области образуют надежный фон, в то время как внутренняя область определяет надмножество переднего плана, то есть неизвестную область. Затем используется так называемая кисть переднего плана, чтобы отметить репрезентативные области переднего плана. Алгоритм выводит маску выбора. Выделение можно уточнить, добавив дополнительные отметки переднего плана или добавив отметки фона с помощью кисти фона.
Технически алгоритм выполняет следующие шаги:
- Создайте набор репрезентативных цветов для определенного переднего плана и надежного фона, так называемые цветовые сигнатуры.
- Назначьте все точки изображения на передний план или задний план с помощью взвешенного поиска ближайшего соседа в цветовых подписях.
- Примените некоторые стандартные операции обработки изображений, такие как размытие, расширение и размытие, для удаления артефактов.
- Найдите связанные компоненты переднего плана, которые либо достаточно велики, либо отмечены пользователем.
Для сегментации видео определенный фон и определенные области переднего плана извлекаются из статистики движения. SIOX также имеет инструменты, которые позволяют с точностью до субпикселей уточнять края и области с высокой текстурой, так называемые «кисти для уточнения деталей».
Как и все сегментация алгоритмов, всегда есть картинки, на которых алгоритм не дает идеальных результатов. Самый критический недостаток SIOX - это цветовая зависимость. Хотя многие фотографии хорошо разделяются по цвету, алгоритм не может справиться с камуфляжем. Если передний план и фон имеют много одинаковых оттенков схожих цветов, алгоритм может дать результат с отсутствующими частями или неправильно классифицированным передним планом. SIOX примерно одинаково хорошо работает в различных тестах по сравнению с методами сегментации на основе графиков, такими как Grabcut. Однако SIOX более устойчив к помехам и поэтому может также использоваться для сегментации видео. Методы сегментации на основе графиков ищут минимальное сокращение и поэтому не работают оптимально со сложными структурами.
Изначально алгоритм был разработан на кафедре информатики в г. Freie Universitaet Berlin. Главный разработчик, Джеральд Фридланд, в настоящее время является преподавателем кафедры EECS Калифорнийский университет в Беркли а также ведущим специалистом по данным в Национальная лаборатория Лоуренса Ливермора. Он продолжает поддерживать развитие через наставничество, например в Google Summer of Code.
Примечания
- ^ Фридланд, Г., Янц, К., Ленц, Т., Визель, Ф., и Рохас, Р. (2006). «Практический подход к точному граничному извлечению множества объектов из неподвижных изображений и видео». Мультимедиа, 2006. ISM'06. Восьмой международный симпозиум IEEE по: 307–316. Дои:10.1109 / ISM.2006.9. ISBN 978-0-7695-2746-8.CS1 maint: несколько имен: список авторов (связь)
Рекомендации
- Г. Фридланд, К. Янц, Р. Рохас: SIOX: Простое интерактивное извлечение объектов из неподвижных изображений, Материалы Международного симпозиума IEEE по мультимедиа (ISM2005), стр. 253–259, Ирвин (Калифорния), декабрь 2005 г. онлайн-статья
- Г. Фридланд, К. Янц, Т. Ленц, Ф. Визель, Р. Рохас: вырезание и вставка объектов в изображения и видео, Международный журнал семантических вычислений Том 1, № 2, стр. 221–247, World Scientific, США, июнь 2007 г. онлайн-статья