Статистическое компрессирование аудио сигналов. Вологдин Э.И. - 31 стр.

UptoLike

Составители: 

31
все время музыкальной программы.
При декодировании в процессе воспроизведения записи осуществляется энтропийное
декодирование, декодирование с предсказанием и преобразование восстановленных бло-
ков данных в непрерывный двоичный поток в формате DSD.
Организация цифрового потока. Перед кодированием исходный 1 битовый звуковой
поток, состоящий из символов
1, 1b
, разделяется на блоки по 37632 бита. При час-
тоте дискретизации 2.82 МГц частота повторения блоков равна 1/75 с. Такая организа-
ция потока данных преследует несколько целей.
Прежде всего, блоковая организация цифрового потока необходима для обеспечения
возможности использования кодирования с адаптивным предсказанием. Такое кодирова-
ние эффективно только при высокой степени корреляции между звуковыми выборками,
по которым осуществляется предсказание. Это значит, что звук в пределах длительности
блока должен быть стационарным или квази- стационарным процессом. Частота повто-
рения блоков выбирается исходя из необходимости обеспечения этого требования.
В качестве энтропийного кодирования в процессе компрессирования используется
арифметический код, который принципиально может работать только при блоковой орга-
низации данных. В этом коде сжимаются данные блоков, и они преобразуются в последо-
вательность двоичных слов.
Последнее замечание, появляется возможность легкого доступа к аудиоданным в
проигрывателе. По этой же причине, блоки должны кодироваться независимо, что позво-
ляет их декодировать по отдельности , без всякой связи с другими блоками.
5.2. Кодирование с предсказанием
Такое кодирование предназначено для компрессирования цифрового потока за счет
сокращения статистической избыточности звукового сигнала. Это достигается тем, что
кодируется не сам звуковой сигнал, а ошибка предсказания. Поэтому главным в таком
кодировании является то, чтобы эта ошибка была минимальна.
В схеме кодера DST на рис.25 предсказатель включает в себя фильтр предсказателя
, цифровой вычитатель (XOR) и реквантователь Q(z). В такой схеме осуществляется пред-
сказание «вперед» по более ранним выборкам ЗС. Передаточная функция фильтра пред-
сказателя
1
()H z z
создает временную задержку выходного сигнала, на один такт, что
необходимо для декодирования. Коэффициенты
цифрового фильтра рассчитываются для каждого
блока данных, хранятся в таблице и передаются
через тракт записи в закодированном виде для
обеспечения работы декодера. Они меняются в
зависимости от характера звукового сигнала, по-
этому процесс предсказания в этой схеме являет-
ся адаптивным.
В блоке XOR осуществляется формирова-
ние сигнала ошибки предсказания
e
, путем оп-
ределения разности между сигналом исходного
цифрового потока
b
и предсказанным сигналом
с выхода фильтра
q
. Если в цифровых потоках
b
и
q
передаваемые данные сильно коррелиро-
ваны, то сигнал ошибки
e
не имеет избыточности, является случайной величиной с рас-
пределением близким к закону Гаусса или Лапласа. Однако, сигнал
e
и коэффициента
фильтра предсказателя вместе несут такую же информацию как сигнал
b
, что позволяет
реконструировать сигнал в декодере без искажений.
Фильтр предсказания разрабатывается по стандартным методам на основе минимиза-
b
e
z
p
t
коэффициенты
фильтра
XOR
Q(z)
таблица
вероятностей
Арифметический
кодер
фильтр
предсказания
01
11
таблица
значений
вероятностей
h
q
d
Рис.25. Схема кодера DST