Человек - интерфейс - компьютер. Будко В.Н. - 51 стр.

UptoLike

Составители: 

анализатор распознавание кодирование
Ввод в ПК
машинного кода
фонемы
звуковая
карта
Запись в память
фрагментов речи
Распознавание и
кодирование
фонем
ПК
7. Устройства ввода - вывода речевой информации (УВВ)
УВВ уже можно отнести к интеллектуальным интерфейсам. Основные достоинства
речевого канала общения с ПК:
- общение ведется в двух направлениях;
- ведется не естественном языке и не требует дополнительного обучения;
- канал самый быстрый и экономичный;
- легко совмещается с другими периферийными устройствами;
- аппаратные средства могут быть малогабаритными и дешевыми.
7.1 Модель речи
В общем случае системы речевого общения строятся на базе двух
специализированных речевых процессоров: анализаторов (устройства ввода (УВв) и
синтезаторов устройства вывода (УВыв)).
Процесс речи, как процесс распознавания слуховых образов, состоит из 3-х этапов:
анализа идентификации и собственно ввода в ПК, рис
Над распознаванием речи работают с 60-х годов. К настоящему времени созданы
УВВ речи в дискретной языковой форме - «диктовка». Но реальные результаты в
распознавании слитной речи пока скромные .
Основные трудности индивидуальность голоса и слитность речи усложняют
анализ и идентификацию единиц речи: звуков, фонем, слов.
В практике УВВ речи анализируют диапазон звуковых колебаний 50 5000 Гц ,
разбивая его на поддиапазоны 3-мя фильтрами: 50 900 Гц , 900 2200 Гц , 2200 5000
Гц . Запас полосы частот против стандарта 400 3000 Гц используется для сохранения
интонации и индивидуальности речи и для увеличения разборчивости речи.
В русском языке 42 фонемы: 6 гласных и 36 согласных. В английском 20 гласных
(из них 5 дифтонгов)и 24 согласных. Однако в слитном потоке речи, в зависимости от
конкретных условий, фонемы изменяются, т.е . появляются оттенки фонем аллофоны.
Общее число аллофонов: 480 гласных и 8880 согласных. Акустические характеристики
фонем определяются артикулярными особенностями мест и способов их образования в
речевом аппарате ротовом и носовом, образующих единую акустическую систему ,
возбуждаемую колебаниями голосовых связок, либо турбулентным шумом.
Распространение звуковых волн в такой системе описывается уравнением
Вебстера:
S(x)
=
1
p 1
2
p
S(x) x x c
2
t
2
7. Устройства ввода-вывода речевой информации (УВВ)
УВВ уже можно отнести к интеллектуальным интерфейсам. Основные достоинства
речевого канала общения с ПК:
   - общение ведется в двух направлениях;
   - ведется не естественном языке и не требует дополнительного обучения;
   - канал самый быстрый и экономичный;
   - легко совмещается с другими периферийными устройствами;
   - аппаратные средства могут быть малогабаритными и дешевыми.


7.1 Модель речи
      В общем случае системы речевого общения строятся на базе двух
специализированных речевых процессоров: анализаторов (устройства ввода (УВв) и
синтезаторов – устройства вывода (УВыв)).
      Процесс речи, как процесс распознавания слуховых образов, состоит из 3-х этапов:
анализа идентификации и собственно ввода в ПК, рис
                                                                       Ввод в ПК
    анализатор           распознавание            кодирование          машинного кода
                                                                       фонемы


        ПК

    звуковая             Запись в память             Распознавание и
    карта                фрагментов речи             кодирование
                                                     фонем




      Над распознаванием речи работают с 60-х годов. К настоящему времени созданы
УВВ речи в дискретной языковой форме - «диктовка». Но реальные результаты в
распознавании слитной речи пока скромные.
      Основные трудности – индивидуальность голоса и слитность речи усложняют
анализ и идентификацию единиц речи: звуков, фонем, слов.
      В практике УВВ речи анализируют диапазон звуковых колебаний 50…5000 Гц,
разбивая его на поддиапазоны 3-мя фильтрами: 50…900 Гц , 900…2200 Гц, 2200…5000
Гц. Запас полосы частот против стандарта 400…3000 Гц используется для сохранения
интонации и индивидуальности речи и для увеличения разборчивости речи.
      В русском языке 42 фонемы: 6 гласных и 36 согласных. В английском – 20 гласных
(из них 5 дифтонгов)и 24 согласных. Однако в слитном потоке речи, в зависимости от
конкретных условий, фонемы изменяются, т.е. появляются оттенки фонем – аллофоны.
Общее число аллофонов: 480 гласных и 8880 согласных. Акустические характеристики
фонем определяются артикулярными особенностями мест и способов их образования в
речевом аппарате – ротовом и носовом, образующих единую акустическую систему,
возбуждаемую колебаниями голосовых связок, либо турбулентным шумом.
      Распространение звуковых волн в такой системе описывается уравнением
Вебстера:
                  1       ∂              ∂p         1    ∂2p
                  S(x)   ∂x     S(x)     ∂x   =     c2   ∂t2