Постановка, классы и дескриптивные элементы задач распознавания изображений

Декабрь 8, 2015 / Комментарии 0

В настоящее время принято выделять три функциональные группы задач, возникающих в процессе работы с изображениями: задачи обработки изображений, задачи анализа изображений и задачи распознавания изображений. Отнесение той или иной задачи к той или иной группе является в некотором смысле субъективным, поскольку в силу специфики предметной области некоторые задачи, входящие в одну из указанных групп, могут относиться к другим группам. Иногда разграничение делается по тому принципу, что к задачам обработки изображений относятся задачи, в которых как входной, так и выходной информацией служат изображения, в то время как задачей анализа изображений является построение двухмерной модели изображения и вычисление специфических характеристик или признаков, необходимых для ее построения.

Для разбиения задач на группы внутри каждой из трех выделенных категорий может быть использована тематическая и техническая классификации. К тематическим задачам относятся задачи, определяющие цель преобразований изображения, а также задачи, которые соответствуют основным видам решений, которые принимаются по информации, представленной в виде изображений. Технические задачи — это элементарные задачи, необходимые для решения тематических задач.

Целью цифровой обработки изображений, как правило, является повышение качества изображений для улучшения его визуального восприятия человеком, обработка изображений для их хранения, представления и передачи в системах машинного зрения или преобразование изображений таким образом, чтобы повысить эффективность их дальнейшего анализа и распознавания.

Ниже перечислены тематические задачи обработки изображений.

1) сжатие изображений — сокращение объема данных, требуемого для представления изображений;

2) улучшение качества изображений — задача, целью которой является либо улучшение визуального восприятия изображения (выявление плохо различимых деталей или подчеркивание интересующих характеристик на изображении, например повышение контраста изображения), либо преобразование его в форму, более удобную для визуального или машинного анализа; при этом не делается попытки приблизить воспроизводимое изображение к некоторому идеализированному оригиналу (это цель задачи восстановления изображений); в некоторых случаях искаженное изображение субъективно воспринимается лучше, чем неискаженный вариант;

3) восстановление изображений — коррекция изображений (устранение геометрических и других искажений, полученных, например, в процессе получения изображений).

К техническим задачам обработки изображений относятся следующие:

1) преобразования, заключающиеся в применении к изображениям арифметических операций (например, сложение, вычитание и т.д.);

2) геометрические преобразования изображений (евклидовы, аффинные, проективные, полиномиальные преобразования и т.д.);

3) яркостная и цветовая коррекция изображений;

4) преобразование контраста изображений;

5) преобразование гистограммы изображений (например, выравнивание или «растягивание» гистограммы);

6) усиление яркостных переходов на изображении;

7) удаление (подавление) шума на изображении;

8) фильтрация изображений;

9) сглаживание изображений;

10) повышение резкости изображений;

11) бинаризация тоновых изображений;

12) кодирование изображений;

13) дискретизация и квантование изображений.

Классификация задач обработки изображений представлена на рис. 1.

р1

Под анализом изображения понимается применение к нему системы преобразований, обеспечивающей извлечение из изображения полезной информации о свойствах изображаемого объекта или процесса. Результатом анализа изображений является приведение изображения к виду, удобному для распознавания, т.е. построение формального описания — модели изображения.

Ниже перечислены тематические задачи анализа изображений:

1) выделение непроизводных элементов, групп пикселов — обнаружение углов, яркостных переходов, границ областей, локальных окрестностей, областей, кривых и т.д.;

2) сегментация изображений — разбиение изображения на однородные области или выделение областей с заданными свойствами;

3) построение описаний выделенных непроизводных элементов, групп пикселов;

4) выбор, выделение и вычисление значений признаков изображений, признаков фрагментов изображений или признаков групп пикселов, используемых при построении моделей изображений;

5) построение и описание моделей изображений;

6) описание двухмерных объектов на изображении;

7) реконструкция изображений — восстановление изображений в целом по их фрагментам; восстановление фрагментов изображения (и объектов) на основе непроизводных элементов и признаков, восстановление пропущенных кадров в последовательности изображений.

К техническим задачам анализа изображений относятся следующие:

1) связывание и классификация яркостных переходов;

2) прослеживание, группировка и представление границ областей;

3) построение остова области;

4) выделение, заполнение и анализ контуров;

5) сегментация кривых;

6) разбиение, заполнение, классификация и представление областей.

Классификация задач анализа изображений представлена на рис. 2.

р2

Задачей распознавания изображений является отнесение изображения, его фрагментов или представленных на нем объектов к некоторому классу, либо разбиение множества изображений, его фрагментов или представленных на нем объектов на несколько классов. Иногда в состав задачи распознавания включают приведение изображения к виду, удобному для распознавания, причем на этапе собственно распознавания в качестве исходной информации выступают модели и представления изображения, его фрагментов или воспроизведенных на нем объектов.

В качестве тематических задач распознавания, возникающих при работе с исходной информацией, представленной в виде изображении, выделяют следующие:

1) преобразование и оценивание моделей и представлений изображений;

2) сопоставление двух изображений в целом для установления их принадлежности к одному классу;

3) сопоставление изображения в целом с набором или серией последовательных (по времени) изображений, представляющих некоторый класс изображений (цель — та же, что и в задаче 2);

4) задачи (2) и (3) для случая нескольких классов;

5) поиск на предъявленном на распознавание изображении некоторой регулярности/нерегулярности (объекта, ситуации), на которую следует обратить внимание, хотя она и не задавалась в априорном перечне эталонов;

6) поиск на предъявленном на распознавание изображении регулярности/нерегулярности/фрагмента заданного вида;

7) разбиение множества изображений на непересекающиеся подмножества (задача автоматической классификации);

8) выбор и формирование траектории задачи распознавания изображений (в постановке задачи распознавания со стандартной обучающей информацией);

9) решение задач (2)-(8) в случаях наличия на изображениях динамических объектов, сложной фоновой обстановки (в т.ч. динамических и статических помех) и с учетом способа получения, формирования и представления изображений.

К техническим задачам распознавания изображений относятся:

1) приведение изображения к виду, удобному для распознавания:

а) оценка информативности и адекватности признаков, использованных при построении модели изображения, фрагментов изображения или представленных на нем объектов;

б) определение и оценивание статистических характеристик признаков изображения, фрагментов изображения или представленных на нем объектов;

в) оценка адекватности модели изображения, фрагментов изображения или представленных на нем объектов;

2) выбор модели алгоритмов распознавания для использования при решении предъявленной задачи распознавания;

3) выбор алгоритма в выбранной модели алгоритмов;

4) адаптация, обучение и модификация выбранного алгоритма применительно к предъявленной задаче распознавания;

5) комбинирование алгоритмов с целью решения предъявленной задачи распознавания и построение алгоритмической схемы, обеспечивающей решение задачи.

Классификация задач распознавания изображений представлена на рис. 3.

р3

В рамках проблемы обработки, анализа и распознавания изображений существуют многочисленные классификации разработанных и используемых методов работы с изображениями, исходя из некоторых общих свойств, так, например, методы сжатия изображений обычно делят на методы сжатия без потерь и методы сжатия с потерями; методы восстановления изображений — на стохастические и детерминированные; пространственные и частотные; адаптивные и неадаптивные; одношаговые, итерационные и рекурсивные; методы фильтрации изображений -на линейные и нелинейные и т.д.

Наиболее естественным является разбиение методов на группы в соответствии с тем, для решения какой задачи или задач тот или иной метод может быть использован. Приведенная выше классификация задач обработки, анализа и распознавания изображений является надежной основой для построения базовой непротиворечивой классификации методов, т.е. каждой выделенной задаче ставится в соответствие группа методов, используемых для ее решения, например, методы фильтрации изображений, методы обнаружения яркостных переходов и т.д.

Одним из наиболее существенных необходимых условий «обоснованного» решения задач анализа и распознавания изображений является построение формального описания исходных данных, в основе которого лежат дескриптивные элементы описания (в классической задаче распознавания — признаковое пространство): их выбор, формирование, вычисление значений, установление логических, функциональных и статистических зависимостей и отношений между дескриптивными элементами, оценивание их информативности. На рис. 4 приведена классификация признаков, обычно используемых в качестве дескриптивных элементов в задачах распознавания.

Подпишитесь на свежую email рассылку сайта!

Читайте также