ВУЗ:
Составители:
анализатор распознавание кодирование
Ввод в ПК
машинного кода
фонемы
звуковая
карта
Запись в память
фрагментов речи
Распознавание и
кодирование
фонем
ПК
7. Устройства ввода - вывода речевой информации (УВВ)
УВВ уже можно отнести к интеллектуальным интерфейсам. Основные достоинства
речевого канала общения с ПК:
- общение ведется в двух направлениях;
- ведется не естественном языке и не требует дополнительного обучения;
- канал самый быстрый и экономичный;
- легко совмещается с другими периферийными устройствами;
- аппаратные средства могут быть малогабаритными и дешевыми.
7.1 Модель речи
В общем случае системы речевого общения строятся на базе двух
специализированных речевых процессоров: анализаторов (устройства ввода (УВв) и
синтезаторов – устройства вывода (УВыв)).
Процесс речи, как процесс распознавания слуховых образов, состоит из 3-х этапов:
анализа идентификации и собственно ввода в ПК, рис
Над распознаванием речи работают с 60-х годов. К настоящему времени созданы
УВВ речи в дискретной языковой форме - «диктовка». Но реальные результаты в
распознавании слитной речи пока скромные .
Основные трудности – индивидуальность голоса и слитность речи усложняют
анализ и идентификацию единиц речи: звуков, фонем, слов.
В практике УВВ речи анализируют диапазон звуковых колебаний 50… 5000 Гц ,
разбивая его на поддиапазоны 3-мя фильтрами: 50… 900 Гц , 900… 2200 Гц , 2200… 5000
Гц . Запас полосы частот против стандарта 400… 3000 Гц используется для сохранения
интонации и индивидуальности речи и для увеличения разборчивости речи.
В русском языке 42 фонемы: 6 гласных и 36 согласных. В английском – 20 гласных
(из них 5 дифтонгов)и 24 согласных. Однако в слитном потоке речи, в зависимости от
конкретных условий, фонемы изменяются, т.е . появляются оттенки фонем – аллофоны.
Общее число аллофонов: 480 гласных и 8880 согласных. Акустические характеристики
фонем определяются артикулярными особенностями мест и способов их образования в
речевом аппарате – ротовом и носовом, образующих единую акустическую систему ,
возбуждаемую колебаниями голосовых связок, либо турбулентным шумом.
Распространение звуковых волн в такой системе описывается уравнением
Вебстера:
S(x)
=
1
∂
∂
p 1
∂
2
p
S(x) ∂x ∂x c
2
∂t
2
7. Устройства ввода-вывода речевой информации (УВВ) УВВ уже можно отнести к интеллектуальным интерфейсам. Основные достоинства речевого канала общения с ПК: - общение ведется в двух направлениях; - ведется не естественном языке и не требует дополнительного обучения; - канал самый быстрый и экономичный; - легко совмещается с другими периферийными устройствами; - аппаратные средства могут быть малогабаритными и дешевыми. 7.1 Модель речи В общем случае системы речевого общения строятся на базе двух специализированных речевых процессоров: анализаторов (устройства ввода (УВв) и синтезаторов – устройства вывода (УВыв)). Процесс речи, как процесс распознавания слуховых образов, состоит из 3-х этапов: анализа идентификации и собственно ввода в ПК, рис Ввод в ПК анализатор распознавание кодирование машинного кода фонемы ПК звуковая Запись в память Распознавание и карта фрагментов речи кодирование фонем Над распознаванием речи работают с 60-х годов. К настоящему времени созданы УВВ речи в дискретной языковой форме - «диктовка». Но реальные результаты в распознавании слитной речи пока скромные. Основные трудности – индивидуальность голоса и слитность речи усложняют анализ и идентификацию единиц речи: звуков, фонем, слов. В практике УВВ речи анализируют диапазон звуковых колебаний 50…5000 Гц, разбивая его на поддиапазоны 3-мя фильтрами: 50…900 Гц , 900…2200 Гц, 2200…5000 Гц. Запас полосы частот против стандарта 400…3000 Гц используется для сохранения интонации и индивидуальности речи и для увеличения разборчивости речи. В русском языке 42 фонемы: 6 гласных и 36 согласных. В английском – 20 гласных (из них 5 дифтонгов)и 24 согласных. Однако в слитном потоке речи, в зависимости от конкретных условий, фонемы изменяются, т.е. появляются оттенки фонем – аллофоны. Общее число аллофонов: 480 гласных и 8880 согласных. Акустические характеристики фонем определяются артикулярными особенностями мест и способов их образования в речевом аппарате – ротовом и носовом, образующих единую акустическую систему, возбуждаемую колебаниями голосовых связок, либо турбулентным шумом. Распространение звуковых волн в такой системе описывается уравнением Вебстера: 1 ∂ ∂p 1 ∂2p S(x) ∂x S(x) ∂x = c2 ∂t2
Страницы
- « первая
- ‹ предыдущая
- …
- 49
- 50
- 51
- 52
- 53
- …
- следующая ›
- последняя »