Новости
12.04.2024
Поздравляем с Днём космонавтики!
08.03.2024
Поздравляем с Международным Женским Днем!
23.02.2024
Поздравляем с Днем Защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

АЛГОРИТМЫ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ЛА НА ОСНОВЕ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ГРАФИЧЕСКИХ ПРОЦЕССОРОВ

Авторы:
Город:
Таганрог
ВУЗ:
Дата:
05 марта 2016г.

Задачи и методы компьютерного зрения в настоящее время широко востребованы во многих областях деятельности человека. Это объясняется успехами современных IT-технологий в области программно- аппаратных средств вычислительной техники – появление мощных центральных и графических процессоров, языковых и алгоритмических средств. В настоящее время интенсивно разрабатываются различные задачи компьютерного распознавания двумерных и трехмерных изображений [1-2]. Спектр решаемых задач достаточно широк и зависит от многих параметров: области использования, типов и количества распознаваемых объектов, качества изображения и способов его получения, наличия шаблонов распознаваемых объектов и других.

В данной работе рассматривается задача распознавания класса объектов военной техники по одному представителю, выбранного из этого класса. В качестве одного из вариантов возможных классов выбирается класс летательных аппаратов типа самолетов, вертолетов, планеров. Аналогичные задачи могут решаться относительно других видов военных объектов, таких как танки, бронетранспортеры, артиллерийские установки, автомашины и т.п. Исходной информацией для решения задачи используются изображения цветные или полутоновые с оттенками серого. Предполагается, что на изображении имеются различные объекты в виде зданий, сооружений, различных элементов ландшафта, а также объекты военной техники, в данном случае – летательные аппараты, подлежащие распознаванию.

Задача распознавания формулируется следующим образом – необходимо выделить все объекты класса по одному случайно выбранному представителю этого класса. Способами выделения могут быть координаты объекта, обрамляющая рамка или контурная граница. В каждом конкретном случае можно дополнительно оговаривать, что следует понимать под координатами и рамкой объекта. Например, координаты могут указывать центр тяжести бинарного изображения объекта или произвольную контрольную точку выделенного объекта. Для рамок могут определяться минимаксные оболочки, рамки вокруг центра тяжести или иные варианты, определяемые постановкой задачи.

Методы компьютерного зрения для решения задач распознавания характеризуются широким набором алгоритмов. Это объясняется тем, что современные технологии компьютерного (технического) зрения не являются конкурентно-способными по отношению к зрению человека. То, что распознается человеком можно разложить на множество разнообразных задач, решаемых компьютерным зрением. Естественно, и в этом случае решение может быть получено с определенной погрешностью. Эти задачи можно разбить на два этапа: обработка изображения с целью подготовки к распознаванию и обработка изображения в процессе распознавания.

Для решения поставленной задачи распознания ЛА на подготовительном этапе определяется тип летательного аппарата по набору шаблонов. Для этого формируются наборы изображений для каждого типа – самолетов, вертолетов и других типов. Число типов определяется самой постановкой задачи с учетом возможных вариантов распознаваемых объектов. Размер набора изображений каждого типа может варьироваться. Увеличение числа изображений повышает вероятность распознавания и увеличивает объем вычислений. Наборы содержат изображения данного  типа ЛА с разными ракурсами и масштабами. Количество их определяется требованиями по объему вычислений и качеству распознавания.

Если изображение, подлежащее распознаванию, является цветным в трехбайтовом формате RGB, то перед распознаванием оно переводится в полутоновое изображение с расчетом интенсивности пикселей по формуле:

I = (R + G + B)/3.

Полученные изображения с оттенками серого предлагается исследовать с помощью девяти масок Wi базиса Фрея-Чена [1], которые представляют собой ортонормированные маски для выявления градиентов, пульсаций, линий и т.д. Эти маски позволяют интерпретировать структуру изображения наложением масок размером 3х3. При этом выполняется подсчет энергии изображения и разложения её на характерные составляющие. По энергетическим значениям можно выделить наиболее характерные элементы изображения.

Энергия Q окрестности изображения N(x(i,j)) размером 3х3 рассчитывается по формуле:


Частные энергетические составляющие по базису определяются как

Q(k) = (N *Wk )2 , k = 1, 2, ..., 9.

В зависимости от распределения частных энергий интерпретируется структура окрестности полутонового изображения.

Характер изображения объекта, подлежащего выделению, можно задать в виде множества S={s1, s2, ... s9}, в котором si может принимать значения 1, если маска Wi соответствует распознаваемому элементу,  и 0, в противном случае. Например, для случая задания подпространства пульсаций, сигнал будет иметь вид S = {0, 0, 1, 1, 0, 0, 0, 0, 0}. В этом случае результат разложения по энергетическим составляющим можно сравнивать с заданным подпространством.

Такой расчет выполняется для выбранных размеров и ракурсов распознаваемых объектов. Размеры и ракурсы можно градуировать с высокой точностью. При этом естественно будет повышаться качество распознавания и объем вычислений. Для качественных изображений с высоким разрешением число обрабатываемых пикселей может достигать 10 Мп и более. При этом следует отметить, что обработка каждого пикселя выполняется по одному алгоритму. Таким образом, решение задачи представляется с множественным потоком данных и одиночной инструкцией (SIMD-архитектура). В этом случае эффективного решения можно добиться реализацией задачи на графических процессорных устройствах, позволяющих вести параллельную обработку данных огромных массивов.

Вычислительный процесс можно построить таким образом, что за один проход будет выполняться расчет по всему объему изображения для заданного размера и ракурса объекта. При этом дается качественная корреляционная оценка результатов сравнения.

Выполнив заданное количество таких проходов, на основе полученных оценок выводится итоговый результат распознавания. При этом можно получить высокоэффективный процесс за счет распределения заданий между центральным графическим процессорами и правильным подбором необходимых видов памяти графического процессора. Организация вычислительного процесса преследует минимизацию обмена данными между процессорами. С этой целью такой обмен достаточно выполнять после обработки всего изображения, что может быть обеспечено использованием константной памяти. Константная память кэшируется и отличается высоким быстродействием. Из графического процессора она может использоваться только для чтения записанных данных. Причем чтение их выполняется простой операцией присваивания. Загрузка константной памяти выполняется через центральный процессор один раз перед обработкой всего изображения. Параллельные процессы обработки изображения следует разбить на n мультипроцессоров так, чтобы накрыть все нити вычислений. В случае недостаточности числа мультипроцессоров, процесс разбивается на ядра последовательной обработки с n мультипроцессорами в каждом ядре.

 

Список литературы

1.     Компьютерное зрение / Л. Шапиро, Дж. Стокман; Пер. с англ. – М.: БИНОМ. Лаборатория знаний, 2006. – 752 с.

2.     Дэвид А. Форсайт, Жан Понс. Компьютерное зрение. Современный подход: Пер. с англ. – М.: Издательский дом «Вильямс», 2004. – 928 с.