ВУЗ:
Составители:
S(x) – функция пощади сечения звукового тракта вдоль оси распространения волн, р –
давление, с – скорость звука , t – время.
Решение этого уравнения – основная забота теории речеобразования. Интонация и
ударение в слитной речи реализуются тремя характеристиками:
- мелодика – изменение частоты основного тона голоса ;
- ритмика – текущее изменение длительности звуков и пауз;
- энергетика – текущее изменение интенсивности звука .
Существуют три метода анализа речи :
1. Метод предварительной визуализации. Анализируются оптические изображения
губ оператора. По опыту языка общения глухонемых (задача бионики ).
2. Анализ колебаний голосовых связок, снимаемых с лорингофона . Пригоден в
условиях сильных помех (кабина самолета , у прокатного стана и т.п.) (задача
бионики).
3. Анализ спектральных характеристик речи: энергетических, частотных, временных
и амплитудных спектров. Применяется для распознавания отдельных слов,
например, команд управления и «диктовок».
Этот метод состоит из нескольких операций.
Вначале – сегментация речи (машинное разбиение речи на фонемы). Для этого речевой
сигнал разбивается на 10-милисекундные дискреты ∆ t. В каждом дискрете оценивается 6
спектральных параметров: 1,2,3-ий параметры – это максимальные значения амплитуд
колебаний в трех поддиапазонах 50… 900 Гц , 900… 2200 Гц , 2200… 5000 Гц , а 4,5,6 –
параметры – это количество переходов через нуль сигналов этих частот, т.е . косвенное
определение частот тех колебаний, которые имеют максимальную амплитуду в каждом из
3-х частотных поддиапазонов.
7.2 Структурная схема анализатора речи
Различают два класса анализаторов: сигналов и сообщений.
В анализаторах сигналов информационный поток сигналов с микрофона (10
5
бит/с)
сжимается (компрессируется) за счет статистических характеристик речевого сигнала без
обращения к его смысловой функции.
В анализаторах речевых сообщений информационный поток компрессируется за
счет введения операции распознавания смысловых элементов речи: фраз, слов, морфем,
фонем. (морфема – наименьшая единица значения; в языке – слова , части слов: приставки ,
суффиксы или их сочетания).
В свою очередь имеем анализаторы с ограниченным словарем и универсальные .
Анализаторы с ограниченным словарем распознают заданное с конкретной целью
некоторое (обычно ~100) количество речевых команд.
Анализатор речевых
сигналов
Нелинейный
корректор
ПК
ПЗУ эталонов
команд
номер
команды
S(x) – функция пощади сечения звукового тракта вдоль оси распространения волн, р – давление, с – скорость звука, t – время. Решение этого уравнения – основная забота теории речеобразования. Интонация и ударение в слитной речи реализуются тремя характеристиками: - мелодика – изменение частоты основного тона голоса; - ритмика – текущее изменение длительности звуков и пауз; - энергетика – текущее изменение интенсивности звука. Существуют три метода анализа речи: 1. Метод предварительной визуализации. Анализируются оптические изображения губ оператора. По опыту языка общения глухонемых (задача бионики). 2. Анализ колебаний голосовых связок, снимаемых с лорингофона. Пригоден в условиях сильных помех (кабина самолета, у прокатного стана и т.п.) (задача бионики). 3. Анализ спектральных характеристик речи: энергетических, частотных, временных и амплитудных спектров. Применяется для распознавания отдельных слов, например, команд управления и «диктовок». Этот метод состоит из нескольких операций. Вначале – сегментация речи (машинное разбиение речи на фонемы). Для этого речевой сигнал разбивается на 10-милисекундные дискреты ∆t. В каждом дискрете оценивается 6 спектральных параметров: 1,2,3-ий параметры – это максимальные значения амплитуд колебаний в трех поддиапазонах 50…900 Гц , 900…2200 Гц, 2200…5000 Гц, а 4,5,6 – параметры – это количество переходов через нуль сигналов этих частот, т.е. косвенное определение частот тех колебаний, которые имеют максимальную амплитуду в каждом из 3-х частотных поддиапазонов. 7.2 Структурная схема анализатора речи Различают два класса анализаторов: сигналов и сообщений. В анализаторах сигналов информационный поток сигналов с микрофона (105 бит/с) сжимается (компрессируется) за счет статистических характеристик речевого сигнала без обращения к его смысловой функции. В анализаторах речевых сообщений информационный поток компрессируется за счет введения операции распознавания смысловых элементов речи: фраз, слов, морфем, фонем. (морфема – наименьшая единица значения; в языке – слова, части слов: приставки, суффиксы или их сочетания). В свою очередь имеем анализаторы с ограниченным словарем и универсальные. Анализатор речевых Нелинейный номер ПК сигналов корректор команды ПЗУ эталонов команд Анализаторы с ограниченным словарем распознают заданное с конкретной целью некоторое (обычно ~100) количество речевых команд.
Страницы
- « первая
- ‹ предыдущая
- …
- 50
- 51
- 52
- 53
- 54
- …
- следующая ›
- последняя »