Человек - интерфейс - компьютер. Будко В.Н. - 52 стр.

UptoLike

Составители: 

S(x) функция пощади сечения звукового тракта вдоль оси распространения волн, р
давление, с скорость звука , t время.
Решение этого уравнения основная забота теории речеобразования. Интонация и
ударение в слитной речи реализуются тремя характеристиками:
- мелодика изменение частоты основного тона голоса ;
- ритмика текущее изменение длительности звуков и пауз;
- энергетика текущее изменение интенсивности звука .
Существуют три метода анализа речи :
1. Метод предварительной визуализации. Анализируются оптические изображения
губ оператора. По опыту языка общения глухонемых (задача бионики ).
2. Анализ колебаний голосовых связок, снимаемых с лорингофона . Пригоден в
условиях сильных помех (кабина самолета , у прокатного стана и т.п.) (задача
бионики).
3. Анализ спектральных характеристик речи: энергетических, частотных, временных
и амплитудных спектров. Применяется для распознавания отдельных слов,
например, команд управления и «диктовок».
Этот метод состоит из нескольких операций.
Вначале сегментация речи (машинное разбиение речи на фонемы). Для этого речевой
сигнал разбивается на 10-милисекундные дискреты t. В каждом дискрете оценивается 6
спектральных параметров: 1,2,3-ий параметры это максимальные значения амплитуд
колебаний в трех поддиапазонах 50 900 Гц , 900 2200 Гц , 2200 5000 Гц , а 4,5,6
параметры это количество переходов через нуль сигналов этих частот, т.е . косвенное
определение частот тех колебаний, которые имеют максимальную амплитуду в каждом из
3-х частотных поддиапазонов.
7.2 Структурная схема анализатора речи
Различают два класса анализаторов: сигналов и сообщений.
В анализаторах сигналов информационный поток сигналов с микрофона (10
5
бит/с)
сжимается (компрессируется) за счет статистических характеристик речевого сигнала без
обращения к его смысловой функции.
В анализаторах речевых сообщений информационный поток компрессируется за
счет введения операции распознавания смысловых элементов речи: фраз, слов, морфем,
фонем. (морфема наименьшая единица значения; в языке слова , части слов: приставки ,
суффиксы или их сочетания).
В свою очередь имеем анализаторы с ограниченным словарем и универсальные .
Анализаторы с ограниченным словарем распознают заданное с конкретной целью
некоторое (обычно ~100) количество речевых команд.
Анализатор речевых
сигналов
Нелинейный
корректор
ПК
ПЗУ эталонов
команд
номер
команды
S(x) – функция пощади сечения звукового тракта вдоль оси распространения волн, р –
давление, с – скорость звука, t – время.
       Решение этого уравнения – основная забота теории речеобразования. Интонация и
ударение в слитной речи реализуются тремя характеристиками:
    - мелодика – изменение частоты основного тона голоса;
    - ритмика – текущее изменение длительности звуков и пауз;
    - энергетика – текущее изменение интенсивности звука.
Существуют три метода анализа речи:
    1. Метод предварительной визуализации. Анализируются оптические изображения
       губ оператора. По опыту языка общения глухонемых (задача бионики).
    2. Анализ колебаний голосовых связок, снимаемых с лорингофона. Пригоден в
       условиях сильных помех (кабина самолета, у прокатного стана и т.п.) (задача
       бионики).
    3. Анализ спектральных характеристик речи: энергетических, частотных, временных
       и амплитудных спектров. Применяется для распознавания отдельных слов,
       например, команд управления и «диктовок».
       Этот метод состоит из нескольких операций.
Вначале – сегментация речи (машинное разбиение речи на фонемы). Для этого речевой
сигнал разбивается на 10-милисекундные дискреты ∆t. В каждом дискрете оценивается 6
спектральных параметров: 1,2,3-ий параметры – это максимальные значения амплитуд
колебаний в трех поддиапазонах 50…900 Гц , 900…2200 Гц, 2200…5000 Гц, а 4,5,6 –
параметры – это количество переходов через нуль сигналов этих частот, т.е. косвенное
определение частот тех колебаний, которые имеют максимальную амплитуду в каждом из
3-х частотных поддиапазонов.


7.2 Структурная схема анализатора речи
       Различают два класса анализаторов: сигналов и сообщений.
       В анализаторах сигналов информационный поток сигналов с микрофона (105 бит/с)
сжимается (компрессируется) за счет статистических характеристик речевого сигнала без
обращения к его смысловой функции.
       В анализаторах речевых сообщений информационный поток компрессируется за
счет введения операции распознавания смысловых элементов речи: фраз, слов, морфем,
фонем. (морфема – наименьшая единица значения; в языке – слова, части слов: приставки,
суффиксы или их сочетания).
       В свою очередь имеем анализаторы с ограниченным словарем и универсальные.



           Анализатор речевых            Нелинейный   номер     ПК
           сигналов                      корректор    команды



                          ПЗУ эталонов
                          команд




      Анализаторы с ограниченным словарем распознают заданное с конкретной целью
некоторое (обычно ~100) количество речевых команд.