Основы прикладной лингвистики. Шилихина К.М. - 12 стр.

UptoLike

Составители: 

Рубрика: 

12
транскрипции в цифровой сигнал, который, в свою очередь,
преобразуется в звуковые колебания при помощи обычного цифро - аналогового
преобразователя.
Автоматическое распознавание речи
Для создания систем автоматического распознавания речи необходимо
решить чрезвычайно трудную задачу формализовать естественный диалог.
Трудность этой задачи не только практическая, но и теоретическая. Достаточно
сказать, что до сих пор не существует единой теории диалога , в которой были
бы учтены лингвистические, социологические и психологические данные
исследований.
Задача систем автоматического распознавания речи состоит в
установлении того , что было сказано, и выдаче результата, например, в виде
фонетической транскрипции или записи другого вида. Для таких систем важно,
чтобы не было никакой посторонней информации, кроме акустической. Иными
словами, данные системы не ориентированы на распознавание смысла
высказывания.
Имеющиеся лингвистические и акустические знания недостаточны для
создания эффективной системы по автоматическому распознаванию речи,
поэтому ученые обратились к спектральному анализу речевого сигнала .
Спектральный анализ предполагает установление того , какие частоты
участвуют в образовании данного звука и какова их интенсивность по
отношению друг к другу . В результате спектрального анализа ученые получают
амплитудно-частотные спектры . Спектральный анализ стал методом анализа
звуков, поскольку известно, что человеческое внутреннее ухо осуществляет
предварительный спектральный анализ речевого сигнала непосредственно
перед поступлением его в мозг.
Для проблемы автоматического распознавания существенны следующие
параметры распознающей системы: количество распознаваемых единиц;
ограничения, связанные с голосом диктора ; свойства самого распознаваемого
сообщения; время распознавания, а также условия распознавания.
Сегодня наиболее успешно с распознаванием речи справляются те
системы, которые используют статистические и вероятностные модели
звучащей речи.
Автоматическая обработка письменного текста
Разработки в области автоматической обработки письменных текстов
ведутся в трех направлениях :
распознавание текста
анализа текста
синтез текста
Технологии распознавания текста необходимы пользователям
компьютеров для облегчения ввода печатного текста путем сканирования.
Начальной характеристикой текста на естественном языке, введенного в память
компьютера , является его буквенный состав. Сюда входят буквы алфавита,
знаки препинания, другие графемы (например, скобки, кавычки, тире ). Ни
                                              12
т ра н скрипции в циф ровой сигн а л, кот орый,                      в      свою       очеред ь,
преоб ра зу ет сяв зву ковые колеб а н ияпри пом ощи об ычн ого циф ро-а н а логового
преоб ра зова теля.
         Ав т ом а т иче с кое ра с позна в а ние ре чи
         Д лясозд а н иясист ем а втом а т ического ра спозн а ва н ияречи н еоб ход им о
реш ит ь чрезвыча йн о т ру д н у ю за д а чу – ф орм а лизова ть ест ествен н ый д иа лог.
Тру д н ость эт ой за д а чи н е только пра кт ическа я, н о и т еоретическа я. Д оста т очн о
ска за т ь, что д о сих порн е су щест ву ет ед ин ой теории д иа лога , в которой б ыли
б ы у чт ен ы лин гвист ические, социологические и психологические д а н н ые
исслед ова н ий.
         За д а ча сист ем а в т ом а т иче с кого ра с позна в а ния ре чи состоит в
у ст а н овлен ии т ого, что б ыло ска за н о, и выд а че резу льт а т а , н а прим ер, в вид е
ф он ет ической т ра н скрипции или за писи д ру гого вид а . Д лят а ких систем ва ж н о,
чт об ы н е б ыло н ика кой посторон н ей ин ф орм а ции, кром е а ку ст ической. И н ым и
слова м и, д а н н ые сист ем ы н е ориен т ирова н ы н а ра спозн а ва н ие см ысла
выска зыва н ия.
         И м еющиесялин гвист ические и а ку ст ические зн а н иян ед ост а т очн ы д ля
созд а н ия эф ф ект ивн ой сист ем ы по а вт ом а тическом у ра спозн а ва н ию речи,
поэтом у у чен ые об ра т ились к спект ра льн ом у а н а лизу речевого сигн а ла .
Спе кт ра л ьный а на л из пред пола га ет у ст а н овлен ие того, ка кие ча ст оты
у ча ству ют в об ра зова н ии д а н н ого зву ка и ка кова их ин тен сивн ост ь по
от н ош ен ию д ру гк д ру гу . В резу льт а т е спект ра льн ого а н а лиза у чен ые полу ча ют
а м плит у д н о-ча ст отн ые спект ры. Спект ра льн ый а н а лиз ста л м етод ом а н а лиза
зву ков, поскольку извест н о, что человеческое вн у т рен н ее у хо осу щест вляет
пред ва рительн ый спектра льн ый а н а лиз речевого сигн а ла н епосред ст вен н о
перед пост у плен ием его в м озг.
         Д ляпроб лем ы а вт ом а тического ра спозн а ва н иясу щест вен н ы след у ющие
па ра м етры ра спозн а ющей сист ем ы: количест во ра спозн а ва ем ых ед ин иц;
огра н ичен ия, связа н н ые с голосом д икт ора ; свойст ва са м ого ра спозн а ва ем ого
сооб щен ия; врем яра спозн а ва н ия, а т а кж е у словияра спозн а ва н ия.
         Сегод н я н а иб олее у спеш н о с ра спозн а ва н ием речи спра вляют ся т е
сист ем ы, которые использу ют ст а т ист ические и вероятн остн ые м од ели
зву ча щей речи.
         Ав т ом а т иче с ка я обра бот ка пис ьм е нного т е кс т а
         Ра зра б отки в об ла ст и а вт ом а т ической об ра б от ки письм ен н ых т екст ов
вед у т сяв т рех н а пра влен иях:
             • ра спозн а ва н ие текст а
             • а н а лиза текста
             • син тезтекст а
         Техн ологии ра с позна в а ния           т е кс т а н еоб ход им ы пользова телям
ком пьют еров д ля об легчен ия ввод а печа тн ого текст а пу т ем ска н ирова н ия.
Н а ча льн ой ха ра кт ерист икой т екст а н а ест ест вен н ом языке, введ ен н ого в па м ять
ком пьют ера , является его б у квен н ый сост а в. Сюд а вход ят б у квы а лф а вита ,
зн а ки препин а н ия, д ру гие гра ф ем ы (н а прим ер, скоб ки, ка вычки, т ире). Н и