Составители:
Рубрика:
14
ЛАБОРАТОРНАЯ РАБОТА № 3
Методы распознавания зашумленных символов
Цель работы: Исследование различающихся по числу и виду исполь
зуемых признаков методов распознавания изображений символов, пред
ставленных в растровой форме, при различной степени их зашумления.
Теоретические пояснения
Обучить машину тому, что умеет человек, создать машину, способ
ную, например, читать – давняя мечта ученых. В течение последних 50
лет эта мечта стала воплощаться в реальность. Распознавание симво
лов – одно из самых плодотворных направлений исследований в облас
ти искусственного интеллекта. Современные программные продукты,
предназначенные для оптического распознавания печатных символов,
успешно заменяют оператора, вводящего в компьютер текст с готового
печатного документа, особенно при наличии документов хорошего и
среднего качества печати. Специализированные системы, ориентиро
ванные на промышленное использование, могут вводить более 100 000
документов в сутки, что позволяет обрабатывать огромные объемы ин
формации, ранее компьютерной обработке не подлежавшие.
Системы оптического распознавания символов (OCR – Optical
Character Recognition) предназначены для перевода растрового изобра
жения в текст. Для получения растрового изображения страницы тек
ста обычно используется монохромный сканер с разрешением от 300
dpi, который позволяет получить вполне удовлетворительное с точки
зрения распознавания растровое изображение.
Программа распознавания должна преобразовать это изображение в
текстовый формат, т. е. присвоить каждому символу некоторый код.
На первом этапе программа выполняет предварительную обработку ра
стрового изображения, которая включает в себя:
– подавление имеющихся яркостных помех;
– коррекцию возможных пространственных искажений;
– бинаризацию, т. е. присвоение пикселям изображения значения
яркости из множества целых чисел (0, 1);
– сегментацию, т. е. выделение фрагмента изображения, включаю
щего только один символ.
В результате каждому распознаваемому символу ставится в соответ
ствие фрагмент бинарного изображения, на котором пиксели, имею
щие значение 1, считаются относящимися к символу, а пиксели, имею
щие значение 0 – к фону.
Страницы
- « первая
- ‹ предыдущая
- …
- 12
- 13
- 14
- 15
- 16
- …
- следующая ›
- последняя »