Признаки символов, используемые для автоматического распознавания. Курсовая работа (т). Информационное обеспечение, программирование.

Признаки символов, используемые для автоматического распознавания. Курсовая работа (т). Информационное обеспечение, программирование.




🛑 👉🏻👉🏻👉🏻 ИНФОРМАЦИЯ ДОСТУПНА ЗДЕСЬ ЖМИТЕ 👈🏻👈🏻👈🏻


























































Информационное обеспечение, программирование

Вы можете узнать стоимость помощи в написании студенческой работы.


Помощь в написании работы, которую точно примут!

Похожие работы на - Признаки символов, используемые для автоматического распознавания

Скачать Скачать документ
Информация о работе Информация о работе


Скачать Скачать документ
Информация о работе Информация о работе


Скачать Скачать документ
Информация о работе Информация о работе


Скачать Скачать документ
Информация о работе Информация о работе


Скачать Скачать документ
Информация о работе Информация о работе


Скачать Скачать документ
Информация о работе Информация о работе


Скачать Скачать документ
Информация о работе Информация о работе

Нужна качественная работа без плагиата?

Не нашел материал для своей работы?


Поможем написать качественную работу Без плагиата!

1.
Типовые проблемы, связанные с распознаванием символов


2.
Структура систем оптического распознавания текстов


3.
Методы предобработки изображений текстовых символов


4.
Признаки символов, используемые для автоматического распознавания


4.1
Корреляция и сопоставление шаблонов


4.2
Статистические распределения точек


6.
Постобработка результатов распознавания


7.
Реализация алгоритма распознавания букв


9.
Анализ алгоритмов оптического распознавания символов


10.
Обзор существующих систем оптического распознавания символов


символ автоматическое распознавание
текстовый


Задача распознавания текстовой информации при
переводе печатного и рукописного текста в машинные коды является одной из
важнейших составляющих проектов, имеющих целью автоматизацию документооборота.
Вместе с тем эта задача является одной из наиболее сложных и наукоемких в
области автоматического анализа изображений. Даже человек, читающий рукописный
текст, в отрыве от контекста делает в среднем 4% ошибок. Что касается систем
считывания печатных документов, то здесь сложность заключается в том, что в
ответственных приложениях, таких как, например, автоматизация ввода
паспортно-визовой информации, необходимо обеспечить высокую надежность
распознавания (более 98-99%) даже при плохом качестве печати и оцифровки
исходного текста.


В последние десятилетия, благодаря использованию
современных достижений компьютерных технологий, были развиты новые методы
обработки изображений и распознавания образов, благодаря чему стало возможным
создание таких систем распознавания печатного текста, которые удовлетворяли бы
основным требованиям систем автоматизации документооборота. Тем не менее,
создание каждого нового приложения в данной области по-прежнему остается
творческой задачей и требует дополнительных исследований в связи со
специфическими требованиями по разрешению, быстродействию, надежности
распознавания и объему памяти, которыми характеризуется каждая конкретная
задача разработки проблемно-ориентированной системы автоматического ввода в
компьютер бумажной документации.


Различные технологии, объединенные под общим
термином "распознавание символов", подразделяются на распознавание в
реальном режиме времени и распознавание в пакетном режиме, каждый из которых
характеризуется собственной аппаратной частью и собственными алгоритмами распознавания.



В типичной системе оптического распознавания
текстов (OCR) вводимые символы читаются и оцифровываются оптическим сканером.
После этого каждый символ подвергается локализации и выделению, и получившаяся
матрица подвергается предобработке, т. е. сглаживанию, фильтрации и
нормализации. В результате предобработки выделяются характерные признаки, после
чего производится классификация. В работе описываются базовые идеи и методы,
позволяющие решить указанные подзадачи, а также их модификации, используемые в
современных системах распознавания.


Теория машинного зрения существует не первый
день, по этому в литературе можно найти достаточно подходов и решений. Для
начала перечислим некоторые из них:


Это метод распознавания одинарных бинарных образов,
основанный на построение скелетов этих образов и выделения из скелетов ребер и
узлов. Далее по соотношению ребер, их числу и числу узлов строится таблица
соответствия образам. Так, например, скелетом круга будет один узел, скелетом
буквы П - три ребра и два узла, причем ребра относятся как 2:2:1. В
программировании данный метод имеет несколько возможных реализаций, подробнее
информацию по методу скелетезации можно найти ниже в разделе ссылки.


Направление было очень популярным в 60е-70е
годы, в последствии интерес к ним немного поубавился, т.к солидное число
нейронов требует солидные вычислительные мощности, которые обычно отсутствуют
на простеньких мобильных платформах. Однако надо иметь ввиду, что нейросети
иногда дают весьма интересные результаты, за счет своей нелинейной структуры,
более того некоторые нейросети способны распознавать образы инвариантные
относительно поворота без какой либо внешней предобработки. Так, например, сети
на основе неокогнейтронов способны выделять некоторые характерные черты
образов, и распознавать их как бы образы не были повернуты.


Из геометрии образов можно выделить некоторые
числа, инвариантные относительно размера и поворота образов, далее можно
составить таблицу соответствия этих чисел конкретному образу (почти как в
алгоритме скелетезации). Примеры инвариантных чисел - число Эйлера,
эксцентриситет, ориентация (в смысле расположения главной оси инерции
относительно чего-нибудь тоже инвариантного).


. Поточечное процентное сравнение с эталоном.


Здесь должна быть некоторая предобработка, для
получения инвариантности относительно размера и положения, затем осуществляется
сравнение с заготовленной базой эталонов изображений - если совпадение больше
чем какая-то отметка, то считаем образ распознанным.







1. Типовые проблемы, связанные с распознаванием
символов




Существует ряд существенных проблем, связанных с
распознаванием рукописных и печатных символов. Наиболее важные из них
следующие:


разнообразие форм начертания символов;


вариации размеров и масштаба символов.


Каждый отдельный символ может быть написан
различными стандартными шрифтами, например (Gothic, Elite, Courier, Orator),
специальными шрифтами, использующимися в системах OCR, а также множеством
нестандартных шрифтов. Кроме того, различные символы могут обладать сходными
очертаниями. Например, 'U и 'V, 'S' и '5', 'Z' и '2', 'G' и '6 '.


Искажения цифровых изображений символов могут
быть следующих видов:


Искажения формы: разорванность строк, непропечатанность
символов, изолированность отдельных точек, неплоский характер информационного
носителя (например, эффект коробления), смещения символов или их частей
относительно местоположения в строке;вращения с изменением наклона
символов;грубым дискретом оцифровке изображений;


Кроме того, необходимо выделить радиометрические
искажения: дефекты освещения, тени, блики, неравномерный фон, ошибки при
сканировании или при съемке видеокамерой.


Существенным является и влияние исходного
масштаба печати. В принятой терминологии масштаб 10, 12 или 17 означает, что в
дюйме строки помещаются 10, 12 или 17 символов. При этом, например, символы
масштаба 10 обычно крупнее и шире символа масштаба 12.


Помимо указанных проблем, система оптического
распознавания текста (OCR), должна выделять на изображении текстовые области, в
них выделять отдельные символы, распознавать эти символы и быть
нечувствительной к способу печати (верстки) и расстоянию между строками.


. Структура систем оптического распознавания
текстов




Как правило, системы OCR состоят из нескольких
блоков, предполагающих аппаратную или программную реализацию:


блок локализации и выделения элементов текста;


блок постобработки результатов распознавания.


В результате работы оптического сканера исходный
текст вводится в компьютер в виде полутонового или бинарного изображения.


В целях экономии памяти и уменьшения затрат
времени на обработку информации, в системах OCR, как правило, применяется
преобразование полутонового изображения в черно-белое. Такую операцию называют
бинаризацией. Однако необходимо иметь в виду, что операция бинаризации может
привести к ухудшению эффективности распознавания.


Программное обеспечение в системах OCR отвечает
за представление данных в цифровом виде и разбиение связного текста на
отдельные символы.


После разбиения символы, представленные в виде
бинарных матриц, подвергаются сглаживанию, фильтрации с целью устранения шумов,
нормализации размера, а также другим преобразованиям с целью выделения
признаков, используемых впоследствии для распознавания.


Распознавание символов происходит в процессе
сравнения выделенных характерных признаков с эталонными признаками, отбираемыми
в ходе статистического анализа результатов, полученных в процессе обучения
системы.


Таким образом, смысловая или контекстная
информация может быть использована как для разрешения неопределенностей,
возникающих при распознавании символов, обладающих идентичными размерами, так и
для корректировки слов и фраз в целом.







3. Методы предобработки изображений текстовых
символов




Предобработка является важным этапом в процессе
распознавания образов и позволяет производить сглаживание, нормализацию,
сегментацию и аппроксимацию отрезков линий.


Сглаживание состоит из операций заполнения и
утоньшения. Заполнение устраняет небольшие разрывы и пробелы.


Утоньшение представляет собой процесс уменьшения
толщины линии, в которой сразу несколько пикселов ставятся в соответствие
только одному пикселу. Известны последовательные, параллельные и гибридные
алгоритмы утоньшения. Наиболее общие методы утоньшения основаны на итеративном
размывании контуров, при котором окно (3х3) движется по изображению, и внутри
окна выполняются соответствующие операции. После завершения каждого этапа все
выделенные точки удаляются.


Скелетизация представляет собой восстановление
траектории пишущего инструмента в качестве входной информации которого
используют либо скелет изображения, либо контур изображения. Несмотря на
большую эффективность использования «скелетизации» восстановление траектории по
скелету изображения имеет существенный недостаток: критически важной
информацией при восстановлении траектории является форма граничного конура в
окрестности областей пересечения штрихов. Из скелета изображения эта информация
недоступна (см. рис. 1). К недостаткам «скелетизации» можно отнести также
большую чувствительность к шуму на границе изображения и, как следствие,
возникновение случайных «отростков» в скелете изображения. Поэтому методы
восстановления траектории, основанные на получении скелета, приводят к ошибкам
при обработке изображений с достаточно сложной траекторией.


Альтернативой «скелетизации» является метод
предобработки, который состоит в следующем: изображение символа разбивается на
полосы черных точек, соответствующие непересекающимся отрезкам штрихов
(регулярные области) и области пересечения штрихов (узловые области).




Рисунок 1 - Изображение символа и его скелет




Существующие алгоритмы выделения регулярных
областей основываются на точечной обработке изображений. В данной работе
предлагается алгоритм, построенный только на использовании ломаной,
аппроксимирующей контур изображения.


Основными особенностями предлагаемого метода
являются:


высокая скорость обработки изображений, которая
достигается за счет отсутствия точечной обработки;


отсеивание изображений, для которых метод
выделения траекторий неприемлем (изображения с пятнами и заплывами) уже на
этапе предобработки.


Нормализация состоит из алгоритмов, устраняющих
перекосы отдельных символов и слов, а также включает в себя процедуры,
осуществляющие нормализацию символов по высоте и ширине после соответствующей
их обработки.


Сегментация осуществляет разбиение изображения
на отдельные области. Как правило, прежде всего необходимо очистить текст от
графики и рукописных пометок, поскольку перечисленные методы позволяют
обрабатывать лишь незашумленный текст. Очищенный от различных пометок текст уже
может быть сегментирован.


Большинство алгоритмов оптического распознавания
разделяют текст на символы и распознают их по отдельности.


Это простое решение действительно эффективно,
если только символы текста не перекрывают друг друга. Слияние символов может
быть вызвано типом шрифта, которым был набран текст, плохим разрешением
печатающего устройства или высоким уровнем яркости, выбранным для
восстановления разорванных символов.


Разбиение текста на слова возможно в том случае,
если слово является состоятельным признаком, в соответствии с которым выполняется
сегментация. Подобный подход сложно реализовать из-за большого числа элементов,
подлежащих распознаванию, но он может быть полезен, если набор слов в кодовом
словаре ограничен по условию задачи.


Под аппроксимацией отрезков линий понимают
составление графа описания символа в виде набора вершин и прямых ребер, которые
непосредственно аппроксимируют цепочки пикселей исходного изображения. Данная
аппроксимация осуществляется в целях уменьшения объема данных и может
использоваться при распознавании, основанном на выделении признаков,
описывающих геометрию и топологию изображения.







4. Признаки символов, используемые для
автоматического распознавания




Считается, что выделение признаков является
одной из наиболее трудных и важных задач в распознавании образов. Для
распознавания символов может быть введено большое количество различных систем
признаков. Проблема заключается в том, чтобы выделить именно те признаки,
которые позволят эффективно отличать один класс символов от всех остальных.


В данном разделе описан ряд основных методик
распознавания символов.




.1 Корреляция и сопоставление шаблонов




Введенная матрица символов сравнивается с
набором эталонов. Вычисляется степень сходства между образом и каждым из
эталонов. Классификация тестируемого изображения символа происходит по методу
ближайшего соседа.


С практической точки зрения этот метод легко
реализовать, и многие коммерческие системы его используют. Однако даже
небольшое темное пятно, попавшее на внешний контур символа, может существенно
повлиять на результат распознавания. Поэтому для достижения хорошего качества
распознавания в системах, использующих сопоставление шаблонов, применяются
другие способы сравнения изображений.


Одна из основных модификаций алгоритма сравнения
шаблонов использует представление шаблонов в виде набора логических правил.







4.2 Статистические распределения точек




В данной группе методов выделение признаков
осуществляется на основе анализа различных статистических распределений точек.
Наиболее известные методики этой группы используют вычисление моментов и
подсчет пересечений.


Моменты различных порядков с успехом
используются в таких задачах обработки изображений как зрение роботов,
обнаружение и распознавание летательных аппаратов и судов по снимкам, анализ
сцен и распознавание символов. В последнем случае в качестве признаков
используют значения статистических моментов совокупности "черных"
точек относительно некоторого выбранного центра.


Наиболее общеупотребительными в приложениях
такого рода являются построчные, центральные и нормированные моменты.


Для цифрового изображения, хранящегося в
двумерном массиве, построчные моменты являются функциями координат каждой точки
изображения следующего вида:




где p,q=0,l,...,; M и N являются
размерами изображения по горизонтали и вертикали и f(x,y) является яркостью
пикселя в точке (х,у) на изображении.


Центральные моменты являются функцией расстояния
точки от центра тяжести символа:




где х и у с чертой - координаты центра тяжести.


Наконец, нормированные центральные моменты
получаются в результате деления центральных моментов на моменты нулевого
порядка.


Следует отметить, что строковые моменты, как
правило, обеспечивают низкий уровень распознавания. Центральные и нормированные
моменты предпочтительнее из-за их большей инвариантности к преобразованиям
изображений.


В методе пересечений признаки формируются путем
подсчета того, сколько раз произошло пересечение изображения символа с
выбранными прямыми, проводимыми под определенными углами, например, 0, 45, 90,
135 градусов. Этот метод часто используется в коммерческих системах благодаря
тому, что он инвариантен к дисторсии и небольшим стилистическим вариациям
символов, а также обладает достаточно высокой скоростью и не требует
значительных вычислительных затрат. Так, например, представлена на рынке
OCR-систем автоматическое устройство, которое читает любые заглавные
буквенно-цифровые символы. В качестве алгоритма распознавания используется
метод пересечений.


Существует множество других методов
распознавания, основанных на выделении признаков из статистического
распределения точек. Например, метод зон предполагает разделение площади рамки,
объемлющей символ, на области, и последующее использование плотностей точек в
различных областях в качестве набора характерных признаков.


В методе матриц смежности в качестве признаков
рассматриваются частоты совместной встречаемости "черных" и
"белых" элементов в различных геометрических комбинациях.




Среди современных технологий распознавания,
основанных на преобразованиях, выделяются методы, использующие
Фурье-дескрипторы символов, а также дескрипторы границ.


Преимущества методов, использующих
преобразования Фурье-Меллина, связаны с тем, что они обладают инвариантностью к
масштабированию, вращению и сдвигу символа. Основной недостаток этих методов
заключается в нечувствительности к резким скачкам яркости на границах. В то же
время, при фильтрации шума на границах это свойство может оказаться полезным.




Структурные признаки обычно используются для
выделения общей структуры образа. Они описывают геометрические и топологические
свойства символа.


Одними из наиболее используемых признаков
являются штрихи и пробелы, применяемые для определения следующих характерных
особенностей изображения: концевых точек, пересечения отрезков, замкнутых
циклов, а также их положения относительно рамки, объемлющей символ.


Пусть матрица, содержащая утоньшенный символ,
разделена на ряд областей, каждой из которых присвоены буквы А, B, С и т.д.
Символ рассматривается как набор штрихов. При этом штрих является прямой линией
(λ)
или кривой (c), и соединяет некоторые две точки в начертании символа. Штрих
является кривой, если его точки удовлетворяют следующему выражению:




в противном случае - это прямая. В данной
формуле (xi,yi) является точкой, принадлежащей штриху; ax+by+c=0 - уравнение
прямой, проходящей через концы штриха, коэффициент 0.69 получен опытным путем.


При введенных обозначениях признаки символа
могут быть записаны, например, в виде 'AλC'
и 'AcD', что означает наличие прямой, проходящей из области 'А' в область 'С',
и кривой, проходящей из области 'А' в область 'D' соответственно. Достоинство
структурных признаков по сравнению с другими методами определятся устойчивостью
к сдвигу, масштабированию и повороту символа на небольшой угол, а также - к
возможным дисторсиям и различным стилевым вариациям шрифтов.


К сожалению, задача выделения признаков данного
типа находится пока в процессе исследования и не имеет еще общепризнанного
решения.







В существующих системах OCR используются
разнообразные алгоритмы классификации, то есть отнесения признаков к различным
классам. Они существенно различаются в зависимости от выбранных признаков и от
правил классификации.




Для классификации символов необходимо в первую
очередь создать библиотеку эталонных векторов признаков. Для этого на стадии
обучения оператор или разработчик вводит в систему OCR большое количество
образцов начертания символов. Для каждого образца система выделяет признаки и
сохраняет их в виде соответствующего вектора признаков. Набор векторов
признаков, описывающих символ, называется классом или кластером.


В процессе эксплуатации системы OCR может
появиться необходимость расширить базу знаний. Для осуществления данной цели
некоторые системы обладают возможностью дообучения в реальном режиме времени.
Однако процесс обучения требует участия оператора и существенных затрат
времени, хотя и проводятся исследования, направленные на автоматизацию процесса
обучения, что в будущем позволит свести к минимуму участие в нем
человека-оператора.


Задачей классификации является определение
класса, которому принадлежит вектор признаков, полученный для данного символа.


Алгоритмы классификации основаны на определении
степени близости набора признаков рассматриваемого символа каждому из классов.
Правдоподобие получаемого результата зависит от выбранной метрики пространства
признаков. К наиболее известным метрикам относится Евклидово расстояние:


где - i-й признак из j-го эталонного
вектора; - i-й
признак тестируемого изображения символа.


При классификации по методу
ближайшего соседа символ будет отнесен к классу, вектор признаков которого
наиболее близок к вектору признаков символа. Следует учитывать, что затраты на
вычисления возрастут с увеличением количества используемых признаков и классов.


Одна из методик, позволяющих
улучшить метрику сходства, основана на статистическом анализе эталонного набора
признаков. При этом в процессе классификации более надежным признакам отдается
больший приоритет:




Другая методика классификации, требующая знания
априорной информации, основана на использовании формулы Байеса. Из правила
Байеса следует, что рассматриваемый вектор признаков принадлежит классу
"j", если отношение правдоподобия К больше чем отношение априорной
вероятности класса j к априорной вероятности класса L.




Искусственные нейронные сети достаточно широко
используются при распознавании символов. Алгоритмы, использующие нейронные сети
для распознавания символов, часто строятся следующим образом. Поступающее на
распознавание изображение символа (растр) приводится к некоторому стандартному
размеру. Как правило, используется растр размером 16х16 пикселей. Примеры таких
нормализованных растров показаны на Рис. 2.




Значения яркости в узлах нормализованного растра
используются в качестве входных параметров нейронной сети. Число выходных
параметров нейронной сети равняется числу распознаваемых символов. Результатом
распознавания является символ, которому соответствует наибольшее из значений
выходного вектора нейронной сети (см. Рис 3, показана только часть связей и
узлов растра). Повышение надежности таких алгоритмов связано, как правило, либо
с поиском более информативных входных признаков, либо с усложнением структуры
нейронной сети.


Надежность распознавания и потребность программы
в вычислительных ресурсах во многом зависят от выбора структуры и параметров
нейронной сети. Изображения цифр приводятся к единому размеру (16х16 пикселей).
Полученное изображение подается на вход нейронной сети.




В качестве входных параметров нейронной сети
вместо значений яркости в узлах нормализованного растра могут использоваться
значения, характеризующие перепад яркости. Такие входные параметры позволяют
лучше выделять края буквы. Система распознавания рукопечатных цифр,
использующие такие входные параметры. Поступающие на распознавание изображения
приводятся к размеру 16х16 пикселей. После этого они подвергаются
дополнительной обработке с целью выделения участков с наибольшими перепадами в
яркости.


Одним из широко используемых методов повышения
точности распознавания является одновременное использование нескольких
различных распознающих модулей и последующее объединение полученных результатов
(например, путем голосования). При этом очень важно, чтобы алгоритмы,
используемые этими модулями, были как можно более независимы. Это может
достигаться как за счет использования распознающих модулей, использующих
принципиально различные алгоритмы распознавания, так и специальным подбором
обучающих данных.


Один из таких методов был предложен несколько
лет назад и основан на использовании трех распознающих модулей (машин). Первая
машина обучается обычным образом. Вторая машина обучается на символах, которые
были отфильтрованы первой машиной таким образом, что вторая машина видит смесь
символов, 50% из которых были распознаны первой машиной верно и 50% неверно.
Наконец, третья машина обучается на символах, на которых результаты
распознавания 1-ой и 2-ой машин различны. При тестировании распознаваемые
символы подаются на вход всем трем машинам. Оценки, получаемые на выходе всех
трех машин складываются. Символ, получивший наибольшую суммарную оценку
выдается в качестве результата распознавания.


Более детальная информация по данному методу
распознавания образов представлена в приложении «Б».





6. Постобработка результатов распознавания




В высокоточных системах OCR, таких как,
например, системы считывания и обработки машиночитаемых паспортно-визовых
документов, качество распознавания, получаемое при распознавании отдельных
символов, не считается достаточным. В таких системах необходимо использовать
также контекстную информацию. Использование контекстной информации позволяет не
только находить ошибки, но и исправлять их.


Существует большое количество приложений OCR, использующих
глобальные и локальные позиционные диаграммы, триграммы, п-граммы, словари и
различные сочетания этих методов. Рассмотрим два подхода к решению такой
задачи: словарь и набор бинарных матриц, аппроксимирующих структуру словаря.


Доказано, что словарные методы являются одними
из наиболее эффективных при определении и исправлении ошибок классификации
отдельных символов. При этом после распознавания всех символов некоторого слова
словарь просматривается в поисках этого слова, с учетом того, что оно, возможно,
содержит ошибку. Если слово найдено в словаре, это не говорит об отсутствии
ошибок. Ошибка может превратить одно слово, находящееся в словаре, в другое,
также входящее в словарь. Такая ошибка не может быть обнаружена без
использования смысловой контекстной информации, только она может подтвердить
правильность написания. Если слово в словаре отсутствует, считается, что в
слове допущена ошибка. Для исправления ошибки прибегают к замене такого слова
на похожее слово из словаря. исправление не производится, если в словаре
найдено несколько подходящих вариантов замены. В этом случае интерфейс
некоторых систем позволяет предложить пользователю различные варианты решения,
например, исправить ошибку, игнорировать ее и продолжать работу или внести это
слово в словарь.


Главный недостаток в использовании словаря
заключается в том, что операции поиска и сравнения, применяющиеся для
исправления ошибок, требуют значительных вычислительных затрат, возрастающих с
увеличением объема словаря.


Некоторые разработчики с целью преодоления
трудностей, связанных с использованием словаря, пытаются выделять информацию о
структуре слова из самого слова. Такая информация говорит о степени
правдоподобия п-граммов (например, пары и тройки букв) в тексте. N-граммы также
могут быть глобально позиционированными, локально позиционированными или вообще
непозиционированными.


Например, степень достоверности
непозиционированной пары букв может быть представлена в виде бинарной матрицы,
элемент которой равен 1, тогда и только тогда, когда соответствующая пара букв
имеется в некотором слове, входящем в словарь. Позиционная бинарная диаграмма
Dy является бинарной матрицей, определяющей, какая из пар букв имеет ненулевую
вероятность возникновения в конкретной позиции (i,j). Набор всех позиционных
диаграмм включает бинарные матрицы для каждой пары положений.







7. Реализация алгоритма распознавания букв




В рамках курсовой работы была написана программа
частично реализующая основные блоки автоматического распознавания букв.


На рисунке 4 представлена блок схема реализуемой
программы.




























Загрузка изображения. Для начала нам необходимо
изображение, с которым потом можно работать. Загружаем его стандартными
методами ОС Windows.


В данной программе распознаются только бинарные
образы, поэтому вторым этапом после получения картинки, она бинаризуется. При
работе с цветным изображением преобразование из цветного в черно-белое
изображение идет по стандартной формуле


Далее алгоритм довольно прост: есть некоторая
планка, если цвет оттенка серого выше - он считается белым, если ниже -
считается черным. Как видно бинаризация очень проста, однако для серьезного
улучшения качества работы распознавания, и уменьшения времени работы
последующих модулей, на этом месте лучше ввести некий фильтр, пускай даже самый
простенький. В данной программе не используется никакой фильтр, однако место
где он может быть включен обозначено.


Зачастую полученное изображение изобилует
помехами, не имеющими никакого отношения к символам и только мешающие процессу
распознавания. Используя простейший метод, считающий плотность точек в заданной
области, удается избавиться от большего количества помех.


Разбиение изображения на части, каждая из
которых содержит свой уникальных объект называется сегментацией.


В данной программе реализовано попиксельное
сравнение с эталонными символами заданного шрифта. Если процент совпадения
эталона и выделенного символа не ниже заданной границы, то символ считается
распознанным.


Исходный текст программы находится в приложении
А.







Открываем изображение (Рис. 5). Подходит любое
изображение в формате BMP.




Для распознавания необходимо выбрать пункт меню
«Распознать». После этого происходит бинаризация, очистка от шума (Рис. 6) и
начинается сам процесс распознавания символов (Рис. 7).




Рисунок 6 - Бинаризация и удаление шума




Распознанные символы после окончания работы
программы выводятся в строке под рисунком (Рис 8).




9. Анализ Алгоритмов оптического распознавания
символов




В случае, когда речь идет о распознавании
печатных символов следует упомянуть, что почти бесконечное разнообразие
печатной продукции изготавливается при помощью ограниченного набора оригиналов
символов, которы
Похожие работы на - Признаки символов, используемые для автоматического распознавания Курсовая работа (т). Информационное обеспечение, программирование.
Реферат: Устойчивость пшеницы к мучнистой росе
Отчет По Курсовым Разницам
Аргументы Для Сочинения Нравственный Выбор
Доклад по теме Березневі статті
Реферат На Тему Предмет И Становление Эстетики
Эссе Английский Егэ Клише 2022
Дипломная работа по теме Специфика деятельности социального педагога по развитию одаренности у детей в условиях образовательного учреждения
Базаров Глазами Героев Сочинение
Доклад: Договор о патентной кооперации (РСТ)
Курсовая работа по теме Поперечная рама
Курсовая работа по теме Обзор рынка офисной недвижимости в Москве
Анализ Расходов Курсовая Работа
Курсовая работа по теме Трагедия церковного разделения: "Речь идет об оппозиции восток-запад"
Цели и задачи курсовой работы
Дипломная работа: Особенности творчества Клода Дебюсси. Скачать бесплатно и без регистрации
Институциональная Теория Реферат
Реферат: Исследования
Как Написать Задачи В Реферате
Реферат На Тему Господарство Стародавнього Китаю
Дипломная работа по теме Внутрифирменное обучение персонала по результатам оценки в торговой организации
Курсовая работа: Двусторонние американо-японские отношения в области безопасности
Реферат: Brurrito Essay Research Paper Chris Cronk2nd hour
Реферат: Предмет и метод регулирования гражданско-правовых отношений

Report Page