Человек - интерфейс - компьютер. Будко В.Н. - 51 стр.

UptoLike

ВУЗ:

ВГУ | Воронеж

Составители:

Будко В.Н.

Рубрика:

Информатика и информационные технологии

анализатор распознавание кодирование

Ввод в ПК

машинного кода

фонемы

звуковая

карта

Запись в память

фрагментов речи

Распознавание и

кодирование

фонем

ПК

7. Устройства ввода - вывода речевой информации (УВВ)

УВВ уже можно отнести к интеллектуальным интерфейсам. Основные достоинства

речевого канала общения с ПК:

- общение ведется в двух направлениях;

- ведется не естественном языке и не требует дополнительного обучения;

- канал самый быстрый и экономичный;

- легко совмещается с другими периферийными устройствами;

- аппаратные средства могут быть малогабаритными и дешевыми.

7.1 Модель речи

В общем случае системы речевого общения строятся на базе двух

специализированных речевых процессоров: анализаторов (устройства ввода (УВв) и

синтезаторов – устройства вывода (УВыв)).

Процесс речи, как процесс распознавания слуховых образов, состоит из 3-х этапов:

анализа идентификации и собственно ввода в ПК, рис

Над распознаванием речи работают с 60-х годов. К настоящему времени созданы

УВВ речи в дискретной языковой форме - «диктовка». Но реальные результаты в

распознавании слитной речи пока скромные .

Основные трудности – индивидуальность голоса и слитность речи усложняют

анализ и идентификацию единиц речи: звуков, фонем, слов.

В практике УВВ речи анализируют диапазон звуковых колебаний 50… 5000 Гц ,

разбивая его на поддиапазоны 3-мя фильтрами: 50… 900 Гц , 900… 2200 Гц , 2200… 5000

Гц . Запас полосы частот против стандарта 400… 3000 Гц используется для сохранения

интонации и индивидуальности речи и для увеличения разборчивости речи.

В русском языке 42 фонемы: 6 гласных и 36 согласных. В английском – 20 гласных

(из них 5 дифтонгов)и 24 согласных. Однако в слитном потоке речи, в зависимости от

конкретных условий, фонемы изменяются, т.е . появляются оттенки фонем – аллофоны.

Общее число аллофонов: 480 гласных и 8880 согласных. Акустические характеристики

фонем определяются артикулярными особенностями мест и способов их образования в

речевом аппарате – ротовом и носовом, образующих единую акустическую систему ,

возбуждаемую колебаниями голосовых связок, либо турбулентным шумом.

Распространение звуковых волн в такой системе описывается уравнением

Вебстера:

S(x)

∂

p 1

∂

S(x) ∂x ∂x c

∂t

7. Устройства ввода-вывода речевой информации (УВВ)
УВВ уже можно отнести к интеллектуальным интерфейсам. Основные достоинства
речевого канала общения с ПК:
   - общение ведется в двух направлениях;
   - ведется не естественном языке и не требует дополнительного обучения;
   - канал самый быстрый и экономичный;
   - легко совмещается с другими периферийными устройствами;
   - аппаратные средства могут быть малогабаритными и дешевыми.


7.1 Модель речи
      В общем случае системы речевого общения строятся на базе двух
специализированных речевых процессоров: анализаторов (устройства ввода (УВв) и
синтезаторов – устройства вывода (УВыв)).
      Процесс речи, как процесс распознавания слуховых образов, состоит из 3-х этапов:
анализа идентификации и собственно ввода в ПК, рис
                                                                       Ввод в ПК
    анализатор           распознавание            кодирование          машинного кода
                                                                       фонемы


        ПК

    звуковая             Запись в память             Распознавание и
    карта                фрагментов речи             кодирование
                                                     фонем




      Над распознаванием речи работают с 60-х годов. К настоящему времени созданы
УВВ речи в дискретной языковой форме - «диктовка». Но реальные результаты в
распознавании слитной речи пока скромные.
      Основные трудности – индивидуальность голоса и слитность речи усложняют
анализ и идентификацию единиц речи: звуков, фонем, слов.
      В практике УВВ речи анализируют диапазон звуковых колебаний 50…5000 Гц,
разбивая его на поддиапазоны 3-мя фильтрами: 50…900 Гц , 900…2200 Гц, 2200…5000
Гц. Запас полосы частот против стандарта 400…3000 Гц используется для сохранения
интонации и индивидуальности речи и для увеличения разборчивости речи.
      В русском языке 42 фонемы: 6 гласных и 36 согласных. В английском – 20 гласных
(из них 5 дифтонгов)и 24 согласных. Однако в слитном потоке речи, в зависимости от
конкретных условий, фонемы изменяются, т.е. появляются оттенки фонем – аллофоны.
Общее число аллофонов: 480 гласных и 8880 согласных. Акустические характеристики
фонем определяются артикулярными особенностями мест и способов их образования в
речевом аппарате – ротовом и носовом, образующих единую акустическую систему,
возбуждаемую колебаниями голосовых связок, либо турбулентным шумом.
      Распространение звуковых волн в такой системе описывается уравнением
Вебстера:
                  1       ∂              ∂p         1    ∂2p
                  S(x)   ∂x     S(x)     ∂x   =     c2   ∂t2

Заказать работу

Вы здесь

Человек - интерфейс - компьютер. Будко В.Н. - 51 стр.

UptoLike

ВУЗ:

Будко В.Н.

Информатика и информационные технологии

Страницы