Дискретные системы и цифровая обработка сигналов. Дахнович А.А. - 54 стр.

UptoLike

Составители: 

Рассмотрим последнее применение более подробно, чтобы на деле оценить выигрыш, достигаемый с помощью АФ.
Линейное предсказаниеэто процедура, позволяющая предсказать будущее значение отсчетов сигнала по предыдущим
M
отсчетам:
=
+
=
1
0
1
~
M
k
kiki
yay . (5.19)
Для бесконечно длинной последовательности отсчетов коэффициенты
k
a в общем случае не могут оставаться постоян-
ными, однако можно разбить эту последовательность на кадры из L отсчетов каждый, так чтобы в пределах кадра эти коэф-
фициенты можно было бы считать постоянными. В итоге мы приходим к АФ, который время от времени (или от кадра к
кадру) корректирует свои коэффициенты. Коэффициенты
k
a вычисляются на кадре согласно МНК, т.е. из условия
=
=
L
n
nn
yyΕ
1
2
)
~
(min . (5.20)
Рис. 5.6
Рис. 5.7
Построенный таким образом на данном кадре фильтр на следующем кадре используется как линейный предсказатель
(ЛП), а наблюдаемые на этом новом кадре отсчеты сигнала используются для вычисления новых коэффициентов
k
a , кото-
рые будут использоваться для ЛП на следующем кадре и т.д. Такой адаптивный фильтрлинейный предсказатель (АФ-ЛП)
широко используется в системах ЦОС.
На рис. 5.6 приведена иллюстрация того, как АФ-ЛП используется для моделирования голосового сигнала в синтезато-
ре речи.
Задавая коэффициенты ЛП, параметр тон/шум и коэффициент передачи усилителя, можно синтезировать любой звук
или последовательность звуков. При этом оказывается, что информация для управления синтезом некоторой речевой фразы
занимает в памяти значительно меньший объем, чем если бы мы записали в память саму эту фразу.
Основываясь на этом факте были разработаны многочисленные вокодеры. Обобщенная схема вокодера представлена на
рис. 5.7.
Длительность кадра в современных вокодерах 15…30 мс. При частоте дискретизации 8 кГц в кадре содержится от 120
до 240 отсчетов. Рассмотрим случай вокодеров стандарта LPC-10. В них используется ЛП 10-го порядка на кадрах речи в 20
мс.
Пусть АЦП имеет 12 бит, а частота дискретизации f
D
= 8 кГц. При прямой передаче кадра потребуется за 20 мс переда-
вать
1920102010812
33
кадра
==
tfn
D
бит.
В вокодере же 10-го порядка необходимо передать:
коэффициенты ЛП 12 бит
×
10 = 120 бит
Источник возбуждения
Генератор основного тона
(для гласных)
Генератор белого шума
(для согласных)
Регули-
руемый
усилитель
ЛП
Порядка
M
Выход
тон/шум
Интенсивность
Коэффициенты
АФ-ЛП
порядка
M
Параметр
тон/шум
Выделитель
основного тона
К
О
Д
Е
Р
Д
Е
К
О
Д
Е
Р
Кадр
речи
длины
L
АФ-ЛП
порядка
M
ГОТ
ГШ
Коэффициенты
{
a
k
}
тон/шум
Выход
y(n)
Основной тон
Интенсивность
Канал
связи
Анализатор
Синтезатор
Коэффициенты
{
a
k
}
тон/ш
у
м
Основной тон