18 февраля 2018г.
Аннотация. В статье дана постановка задачи распознавания, представлен обзор моделей и алгоритмов, предназначенных для распознавания объектов, в том числе лиц человека. Рассмотрена актуальная задача наведения 3D модели лица на 2D изображение
Ключевые слова: инварианты, 3D модели лица, задача наведения, сегментация, области интереса, нейронные сети.
Введение
В задачах распознавания лиц целесообразно выделять инварианты - такие характеристики изображения (дескрипторы), которые не зависят от масштаба, ориентации и качества анализируемого снимка. Широкое распространение получили яркостные и геометрические инварианты изображений. Инварианты полезны тем, что способны выступать в роли существенных признаков, передающих характерные особенности изображения. Они позволяют проводить корректное сравнение изображений подвергнутых, преобразованиям, что увеличивает вероятность получения правильного решения. [1].
В работе [2] было показано, что в качестве инвариантов могут выступать как простые признаки, так и сложные интегральные, которые являются более устойчивыми к различным помехам. Однако, следует отметить, что реальное распознавание объектов усложняется тем, что инварианты вследствие влияния различных факторов, например помех, могут флуктуировать, они фактически являются «субинвариантами». В этой связи в качестве методов распознавания приходится привлекать вероятностные подходы и специальные метрики для сравнения инвариантов, например метрику Евклида-Махаланобиса. [3]. В работе [1] представлен комбинированный подход, в котором сочетаются следующие инструменты: методы выделения инвариантных моментов Ху, методы формирования эталонных классов лиц, метрика Евклида- Махаланобиса и аппарат искусственных нейронных сетей (ИНС) [4].
В ряде случаев 3D-алгоритмы имеют преимущества по сравнению с 2D распознаванием [5]. Хорошие результаты в области 3D-распознавания были получены компанией Vocord. Они разработали прототип системы с использованием камер высокого разрешения, без использования какой-либо дополнительной подсветки. Данные преимущества позволяют использовать разработанную систему для некооперативной идентификации людей на основе 3D моделей. Показаны высокие характеристики распознавания с вероятностью 92-98%. В связи с этим, важную роль играют 3D-инварианты, которые следует наилучшим образом «нацеливать» на имеющиеся двумерные объекты [6,7].
В работе [2] проведены экспериментальные исследования, подтверждающие перспективность распознавания на основе инвариантов. В табл. 3 представлены результаты экспериментальной проверки качества распознавания различными методами, а именно количество допущенных ошибок при распознавании лиц из одной из открытых баз [9].
Таблица 3 −Сводная таблица результатов экспериментов
Количество допущенных ошибок
|
Метрика Евклида
|
Метрика Евклида- Махаланобиса
|
ИНС прямого распространения
|
Вероятностная ИНС
|
6
|
2
|
4
|
2
|
Из результатов следует, что приоритет по качеству классификации принадлежит метрике Евклида- Махаланобиса и вероятностной нейронной сети. Инварианты в комплексе с другими методами, показали долю ошибки распознавания лиц примерно 1,5-4,5%.
1. 3D
–инварианты для распознавания лиц
Эксперименты показывают, что 2D-модели имеют ограниченное применение, поскольку их затруднительно применять для распознавания лиц при различных ракурсах головы, естественной мимики, наличии гримас и других помех. В связи с этим все большее внимание уделяется 3D-моделям, полученным с использованием камер высокого разрешения, применение которых в ряде случаев позволяет увеличить точность и полноту распознавания [5,10,11].
Одной из задач
в работе [12] явилась
экспериментальная проверка и формирование набора 3D- инвариантов для распознавания лиц. 3D-инвариантные моменты являются удобным средством для решения задач прямого сравнения и распознавания лиц, подвергаемых различным преобразованиям и искажениям.
Для дискретного случая (цифрового изображения) имеет место:
Заключение
Проанализировав некоторое количество источников в области распознавания образов можно отметить, что перспективным направлением является 3D распознавание, так как традиционные системы двухмерного распознавания используют участки изображения с высокой контрастностью, такие как глаза, рот, нос, границы лица, и плохо используют информацию в областях низкого контраста – на щеках, лбу, подбородке. В отличие от этого, трехмерное использует для анализа информацию с участков низкой контрастности. Форма поверхности лба и других слабо деформируемых участков лица мало подвержена изменениям при различных выражениях лица, что также используется в 3D-распознавании.
Список литературы
1. Нгуен Зуй Тхань, Фраленко В.П., Хачумов М.В. Распознавание лиц на основе инвариантов к аффинным и яркостным преобразованиям // Свидетельство о государственной регистрации программы для ЭВМ № 2017617799, дата поступления заявки: 23.05.2017, дата регистрации: 12.07.2017.
2. Хачумов М.В., Нгуен Зуй Тхань. Задача распознавания лиц по фотографиям на основе инвариантных моментов. – Искусственный интеллект и принятие решений, № 4, 2016, с. 5-14.
3. Нгуен Зуй Тхань. Инварианты в задачах распознавания графических образов. − Вестник Российского университета дружбы народов. Серия: Математика, информатика, физика, 2016, № 1, с. 76-85.
4.
Амелькин С.А., Захаров А.В., Хачумов В.М. Обобщенное расстояние Евклида-Махаланобиса и его свойства. − Информационные технологии и вычислительные системы, 2006, № 4, с. 40-44.
5.
Петухов
М.Н., Фаворская
М.Н. Распознавание
природных
объектов
на аэрофотоснимках
с применением нейронных сетей. – Автометрия. 2011, № 3, с. 34-40.
6.
Манолов А.И., Соколов А.Ю., Степаненко О.В. и др. Некооперативная биометрическая идентификация по 3D-моделям лица с использованием видеокамер высокого разрешения. – Труды 19-й Международной конференции по компьютерной графике и зрению «ГрафиКон’2009», (Москва, 5 – 9 октября 2009 г.). – М.: МАКС ПРЕСС, 2009. – http://www.graphicon.ru/html/2009/conference/se8/139/139_Paper.pdf
7.
Нгуен Зуй Тхань, Хачумов В.М. Модели и методы сопоставления изображений в задаче распознавания лиц. – Искусственный интеллект и принятие решений анализ данных. 2016, с. 5-14
8. Нгуен З. Т., Хачумов М.В. Метод наведения 3D-модели объекта на 2D-изображение на основе инвариантных моментов. − Программные системы: теория и приложения, 2017, №4, с. 209–220.
9. Хачумов М.В. Расстояния, метрики
и кластерный анализ. – Искусственный интеллект и принятие решений, № 1, 2012, с. 81-89.
10.
Casati J., Moraes D., Rodrigues E. SFA: A Human Skin Image Database based on FERET and AR Facial Images // In: IX Workshop de Visão Computacional, 2013. URL: http://www.sel.eesc.usp.br/sfa/
11.
Naser Zaeri and Faris Baker. Thermal Face Recognition Using Moments Invariants. – International Journal of Signal Processing Systems, Vol. 3, No. 2, December 2015, pp. 94-99.
12.
Роженцов А.А., Морозовский К.В., Баев А.А Модифицированное обобщённое преобразование Хафа для обработки трёхмерных изображений с неизвестными параметрами вращения и масштабирования. − Автометрия, 2013, № 2, с.30-41.
13. Нгуен Т., Хачумов М.В.. Метод наведения 3D-модели объекта на 2D-изображение на основе инвариантных моментов. – «Программные системы: теория и приложения», №4 (Том 8), 2017, с. 209-220.