Доклады о будущих и современных технологиях
ПРИМЕНЕНИЕ HOG — ДЕСКРИПТОРОВ ДЛЯ ОПИСАНИЯ ОБЪЕКТОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ
В. А. Петров, Д. В. Федорин, А. Е. Кралин
Научный руководитель - А. Л. Приоров, д-р техн. наук, доцент
Ярославский государственный университет им. П. Г. Демидова
Человек может сравнивать изображения и выделять на них объекты визуально, на интуитивном уровне. Однако для машины изображение представляет собой всего лишь ни о чем не говорЯщиЙ набор данных. Существуют определенные методы для описания изображений, основанные на сопоставлении знаний об изображениях в целом. В общем случае это выглядит следующим образом: для каждой точки изображения вычисляется значение определённой функции, и на основании этих значений изображению присваивается определённая характеристика. В таком случае задача сравнения изображений сводится к задаче сравнения таких характеристик, которые будем называть дескрипторами.
Предположим, что внеШнИй вид и форма объекта на участке изображения могут быть описаны распределением градиентов интенсивности. Реализация этих дескрипторов может быть произведена путем разбиения изображения на маленькие связные области, именуемые ячейками, и расчетом для каждой ячейки гистограммы направлений градиентов для пикселов, находящихся внутри ячейки. Комбинация этих гистограмм называется HOG-дескриптором.
Первым шагом в вычислении дескрипторов является расчёт значения градиентов. Самым распространенным методом является применение одномерной дифференцирующей маски в горизонтальном и вертикальном направлениях, однако полезно использовать и двумерные дифференциальные маски (Собеля, Превитт и др.).
На следующем шаге вычисляются гистограммы ячеек. Каждый пиксел в ячейке участвует во взвешенном голосовании для каналов гистограммы направлений, основанном на значении градиентов. Ячейки могут быть прямоугольной или круглой формы, каналы гистограммы равномерно распределяются от 0 до 180 или же от 0 до 360 градусов, в зависимости от того, вычисляется «знаковый» или «беззнаковый градиент».
Дескриптор HOG имеет несколько преимуществ над другими дескрипторами. Поскольку HOG работает локально, данный метод является инвариантным как к геометрическим (смещение, поворот, масштаб), так и к фотометрическим (изменение яркости изображения) преобразованиям, за исключением ориентации объекта. Подобные изменения проявляются только в больших фрагментах изображения.