ВУЗ:
Составители:
Рубрика:
11
Системы автоматической обработки устной речи находят
практическое применение в информационно-справочных службах, где можно
получать информацию из базы данных в режиме диалога (например, в
медицине или на транспорте). Кроме того , такие системы необходимы и для
организации приема и озвучивания сообщений (например, получение
электронной почты по телефону), а также для перевода звучащей речи в
привычный текст в электронной форме. Компьютеры могут оказывать помощь
и при обучении иностранному языку с помощью автоматических фонетических
тренажеров.
Сегодня ученые работают в двух основных направлениях : это
автоматический синтез речи и автоматическое распознавание речи .
Автоматический синтез речи
Первые механические синтезаторы речи появились еще в XVIII веке. Их
создатели ставили целью воспроизвести процессы произнесения звуков с
помощью механического устройства , имитируя строение голосового аппарата
человека . В начале ХХ века механические устройства сменились
электрическими вокодерами. Появление компьютеров оказало мощное влияние
на технологию синтеза речи, т.к. от аналоговых устройств исследователи
перешли к цифровым . Однако на начальном этапе использования компьютеров
для синтеза речи исследователи использовали ограниченное количество
речевых образцов, которые хранились в памяти компьютера , поэтому
результатом работы первых систем был не собственно синтез звучащей речи, а
восстановление этих образцов. С 60-х годов ХХ века перед исследователями
встала задача озвучивания любого сообщения, подобно тому, как человек
читает тексты вслух. В результате получили развитие синтезаторы типа «Текст
– Речь». В них впервые появился этап предварительной лингвистической
обработки текста.
Современные синтезаторы речи включают два блока : блок
лингвистической обработки текста, с помощью которого строится полная
фонетическая транскрипция синтезируемого текста, а также блок
акустического синтеза , который генерирует речевой сигнал. Блок
лингвистической обработки текста имеет достаточно сложную структуру ,
поскольку создание транскрипции включает несколько этапов: определение
языка входного текста, устранение возможных орфографических ошибок,
проведение морфологического анализа словоформ для постановки ударения.
Самая трудная задача этапа лингвистической подготовки текста –
формирование интонации и просодических характеристик фразы . Во многих
случаях для этого необходим значительно более сложный семантический и
синтаксический анализ фразы . Последний этап работы блока лингвистической
подготовки текста – создание фонетической транскрипции. На этом этапе
применяются стандартные правила чтения, при этом сложность и трудоемкость
этого этапа определяется соотношением между орфографией и произношением
каждого конкретного языка .
После создания фонетической транскрипции начинает работу второй
блок синтезатора – блок акустического синтеза . Его задача – перевод
11 Сист ем ы а втом а тической об ра б от ки у ст н ой речи н а ход ят пра кт ическое прим ен ен ие в ин ф орм а цион н о-спра вочн ых слу ж б а х, гд е м ож н о полу ча т ь ин ф орм а цию из б а зы д а н н ых в реж им е д иа лога (н а прим ер, в м ед ицин е или н а тра н спорте). Кром е т ого, та кие систем ы н еоб ход им ы и д ля орга н иза ции прием а и озву чива н ия сооб щен ий (н а прим ер, полу чен ие элект рон н ой почт ы по телеф он у ), а т а кж е д ля перевод а зву ча щей речи в привычн ый текст в элект рон н ой ф орм е. Ком пьют еры м огу т ока зыва т ь пом ощь и при об у чен ии ин ост ра н н ом у языку с пом ощью а втом а тических ф он ет ических т рен а ж еров. Сегод н я у чен ые ра б от а ют в д ву х осн овн ых н а пра влен иях: эт о а в т ом а т иче с кий с инт е з ре чи и а в т ом а т иче с кое ра с позна в а ние ре чи. Ав т ом а т иче с кий с инт е з ре чи П ервые м еха н ические син т еза торы речи появились еще в XVIII веке. И х созд а т ели ст а вили целью воспроизвест и процессы произн есен ия зву ков с пом ощью м еха н ического у ст ройст ва , им ит иру яст роен ие голосового а ппа ра т а человека . В н а ча ле Х Х века м еха н ические у ст ройст ва см ен ились элект рическим и вокод ера м и. П оявлен ие ком пьют еров ока за ло м ощн ое влиян ие н а т ехн ологию син т еза речи, т.к. от а н а логовых у ст ройст в исслед ова тели переш ли к циф ровым . Од н а ко н а н а ча льн ом эт а пе использова н ияком пьют еров д ля син т еза речи исслед ова т ели использова ли огра н ичен н ое количест во речевых об ра зцов, кот орые хра н ились в па м яти ком пьют ера , поэтом у резу льт а т ом ра б от ы первых систем б ыл н е соб ст вен н о син теззву ча щей речи, а восст а н овлен ие эт их об ра зцов. С 60-х год ов Х Х века перед исслед ова т елям и вст а ла за д а ча озву чива н ия люб ого сооб щен ия, под об н о т ом у , ка к человек чит а ет т екст ы вслу х. В резу льт а т е полу чили ра звитие син теза т оры т ипа «Текст – Речь». В н их впервые появился эт а п пред ва рит ельн ой лин гвист ической об ра б от ки т екст а . Соврем ен н ые син т еза т оры речи включа ют д ва б лока : б лок л ингв ис т иче с кой обра бот ки т е кс т а , с пом ощью кот орого ст роит ся полн а я ф он ет ическа я тра н скрипция син т езиру ем ого т екст а , а т а кж е б лок а кус т иче с кого с инт е за , кот орый ген ериру ет речевой сигн а л. Б лок лин гвист ической об ра б от ки т екст а им еет д ост а точн о слож н у ю стру кт у ру , поскольку созд а н ие т ра н скрипции включа ет н есколько эт а пов: опред елен ие языка вход н ого т екста , у ст ра н ен ие возм ож н ых орф огра ф ических ош иб ок, провед ен ие м орф ологического а н а лиза словоф орм д ля пост а н овки у д а рен ия. Са м а я тру д н а я за д а ча эт а па лин гвист ической под гот овки текст а – ф орм ирова н ие ин тон а ции и просод ических ха ра ктерист ик ф ра зы. Во м н огих слу ча ях д ля эт ого н еоб ход им зн а чит ельн о б олее слож н ый сем а н тический и син та ксический а н а лизф ра зы. П ослед н ий эт а п ра б от ы б лока лин гвистической под гот овки т екст а – созд а н ие ф он етической т ра н скрипции. Н а эт ом эт а пе прим ен яют сяст а н д а рт н ые пра вила чт ен ия, при эт ом слож н ост ь и тру д оем кост ь эт ого эт а па опред еляет сясоотн ош ен ием м еж д у орф огра ф ией и произн ош ен ием ка ж д ого кон крет н ого языка . П осле созд а н ия ф он етической тра н скрипции н а чин а ет ра б от у вт орой б лок син теза т ора – б лок а ку стического син теза . Е го за д а ча – перевод
Страницы
- « первая
- ‹ предыдущая
- …
- 9
- 10
- 11
- 12
- 13
- …
- следующая ›
- последняя »