ВУЗ:
Составители:
Рубрика:
- 15 -
время удовлетворительно решенный даже в ‘карманных’ ПЭВМ и машин-
ного перевода (в том числе перевода ‘на лету’ в сети InterNet - например,
приложение
Promt WebView, см. www.promt.ru/rus/products/webview) -
www.promt.ru, www.translate.ru, www.star.spb.ru. Фирма MS на сайте
www.microsoft.com/downloads предлагает специализированную библио-
теку разработчика систем распознавания речи
Microsoft Speech API, сис-
темы распознавания и преобразования текста в речь
Microsoft Speech Rec-
ognition
и Microsoft Text-to-Speech; функциями речевого управления дол-
жен обладать пакет MS Office 10.
Символы внутримашинно представлены численным кодом (обычно
8-ю двоичными разрядами, перспективная кодировка UNICODE использу-
ет 16 бит и позволяет единообразно представить символы 2
16
= 65536 язы-
ков мира); наличие оставшихся от первых лет компьютерной эпохи не-
скольких таблиц кодировок (‘кодовых страниц’ - например, Windows-1251,
Koi8-R и др.) создает трудности при работе. Наиболее распространенным в
сред
е Windows текстовым (с элементами графики) редактором (тексто-
вым процессором
) является MS Word (www.microsoft.com/rus), из попу-
лярных
настольных издательских систем следует упомянуть
Adobe
PageMaker (www.adobe.com), Xerox VenturaPublisher
(
www.xerox.com) и Quark XPress (Quark, Inc., www.quark.com).
Действие OCR-систем заключается в сопоставлении печатным симво-
лам (обычно представляемым в виде сканированного изображения) кодо-
вому набору алфавита, ‘понимаемому’ конкретным ПО обработки текстов
(изображению символа ставится в соответствие его числовой код). Одной
из распространенных OCR-систем является
FineReader фирмы ABBYY
Software
(www.abbyy.ru). Последние версии продуктов этой фирмы
(ABBYY FineReader Рукопись) позволяют распознавать формы (техноло-
гия Document Capture - ‘захват документа’), например, бланки налоговых
деклараций (с занесением информации из определенных полей бланка в
поля базы данных).
Комплекс
Cognitive Forms принадлежит к классу OCR/ICR/OMR
(
Optical Character Recognition / Intelligent Character Recognition / Optical
Mark Recognition
- оптическое распознавание печатных симво-
лов / распознание рукописных символов / оптическое распознание меток)
и реализует трехуровневую технологию распознания.
Для представления текстовой информации в приятной человеку форме
используются шрифты.
Шрифт (гарнитура) - набор символов, схожих по
графическим особенностям. Начертание описывает характерные особенно-
сти шрифта (
bold - жирный, italic - курсивный, normal - прямой). Кегль,
или
размер шрифта (size) определяется высотой прописной буквы, изме-
ренной в
пунктах (points); один пункт равен 1/72 дюйма (0,353 мм), в
шрифте размером 12 пунктов прописные буквы имеют высоту 1/6 дюйма.
- 15 - время удовлетворительно решенный даже в ‘карманных’ ПЭВМ и машин- ного перевода (в том числе перевода ‘на лету’ в сети InterNet - например, приложение Promt WebView, см. www.promt.ru/rus/products/webview) - www.promt.ru, www.translate.ru, www.star.spb.ru. Фирма MS на сайте www.microsoft.com/downloads предлагает специализированную библио- теку разработчика систем распознавания речи Microsoft Speech API, сис- темы распознавания и преобразования текста в речь Microsoft Speech Rec- ognition и Microsoft Text-to-Speech; функциями речевого управления дол- жен обладать пакет MS Office 10. Символы внутримашинно представлены численным кодом (обычно 8-ю двоичными разрядами, перспективная кодировка UNICODE использу- 16 ет 16 бит и позволяет единообразно представить символы 2 = 65536 язы- ков мира); наличие оставшихся от первых лет компьютерной эпохи не- скольких таблиц кодировок (‘кодовых страниц’ - например, Windows-1251, Koi8-R и др.) создает трудности при работе. Наиболее распространенным в среде Windows текстовым (с элементами графики) редактором (тексто- вым процессором) является MS Word (www.microsoft.com/rus), из попу- лярных настольных издательских систем следует упомянуть Adobe PageMaker (www.adobe.com), Xerox VenturaPublisher (www.xerox.com) и Quark XPress (Quark, Inc., www.quark.com). Действие OCR-систем заключается в сопоставлении печатным симво- лам (обычно представляемым в виде сканированного изображения) кодо- вому набору алфавита, ‘понимаемому’ конкретным ПО обработки текстов (изображению символа ставится в соответствие его числовой код). Одной из распространенных OCR-систем является FineReader фирмы ABBYY Software (www.abbyy.ru). Последние версии продуктов этой фирмы (ABBYY FineReader Рукопись) позволяют распознавать формы (техноло- гия Document Capture - ‘захват документа’), например, бланки налоговых деклараций (с занесением информации из определенных полей бланка в поля базы данных). Комплекс Cognitive Forms принадлежит к классу OCR/ICR/OMR (Optical Character Recognition / Intelligent Character Recognition / Optical Mark Recognition - оптическое распознавание печатных симво- лов / распознание рукописных символов / оптическое распознание меток) и реализует трехуровневую технологию распознания. Для представления текстовой информации в приятной человеку форме используются шрифты. Шрифт (гарнитура) - набор символов, схожих по графическим особенностям. Начертание описывает характерные особенно- сти шрифта (bold - жирный, italic - курсивный, normal - прямой). Кегль, или размер шрифта (size) определяется высотой прописной буквы, изме- ренной в пунктах (points); один пункт равен 1/72 дюйма (0,353 мм), в шрифте размером 12 пунктов прописные буквы имеют высоту 1/6 дюйма.
Страницы
- « первая
- ‹ предыдущая
- …
- 13
- 14
- 15
- 16
- 17
- …
- следующая ›
- последняя »