Статистическое компрессирование аудио сигналов. Вологдин Э.И. - 4 стр.

UptoLike

Составители: 

4
В результате при записи звуковых сигналов существенно упростились проблемы с
возможностью повышения частоты дискретизации и числа разрядов ИКМ преобразовате-
лей, не стало жестких ограничений в отношении времени записи и числа записываемых
звуковых каналов. Однако проблемы многоканальной записи пока остались. При емкости
диска формата DVD-A 4,7 Гбайт аудиоданных максимальная скорость цифрового потока,
при которой длительность записи один час, составляет около 10 Мбит/с . При этом без
компрессирования 6-канальная запись возможна только в формате 24/48 кГц. С повыше-
нием частоты дискретизации до 192 кГц скорость цифрового потока увеличивается в 4
раза до 27,5 Мбит/с. Приходится либо уменьшать время записи в 4 раза или использовать
сжатие цифрового потока без потерь с коэффициентом компрессии около 2,7.
В каналах передачи цифровой звуковой информации проблем значительно больше.
Частотный диапазон кабельных и эфирных линий передачи разделяется на полосы, выде-
ляемые пользователям, чем уже полоса, тем больше может одновременно передаваться
сообщений по одному каналу. Число полос ограничено, поэтому каждый лишний бит,
расширяющий полосу передачи, стоит очень дорого. Именно поэтому в этой области и
ведутся интенсивные разработки по сокращению скорости цифровых потоков, часто в
ущерб качеству. Скорости цифровых потоков здесь не сопоставимо меньшие, чем в аппа-
ратуре звукозаписи.
Компрессирование в цифровых каналах используется в телефонных линиях связи, при
передачи речевых и музыкальных сигналов в сети Интернет, в сотовых системах связи,
при передачи вещательных сигналов по кабельным линиям и при многоканальной звуко-
записи на оптических дисках . Речевой сигнал передается с использованием 8-разрядного
кодирования с частотой дискретизации 8 кГц при скорости цифрового потока 64 или 32
Кбит/с. При передаче вещательных сигналов число разрядов увеличивается до 10…12, и
и частота дискретизации повышается до 22,05 или 44,1 кГц. При этом скорость цифрово-
го потока составляет 128 и 256 Кбит/с.
2. Кодирование с адаптацией шага квантования
2.1. ИКМ с неравномерным шагом квантования
Обычная линейная ИКМ не имеет механизма использования статистической избыточ-
ности ЗС. Однако, квантователь с постоянным шагом является оптимальным в смысле
минимизации среднеквадратической ошибки квантования для сигналов с равномерной
плотностью вероятностей распределения (PDF-Pulse Density Function)) мгновенных значе-
ний ЗС. У реальных музыкальных сигналов PDF чаще подчиняется закону Гаусса и
применение линейной ИКМ не эффективно.
В статистически оптимизированной ИКМ шаг квантования определяется PDF кван-
туемого сигнала. Часто встречающиеся амплитуды ЗС квантуются с меньшим шагом, а
редко встречающие с большим (рис.1). Например, при квантовании сигнала с Гауссо-
Рис.1. Статистически оптимизированное квантование