Компрессирование аудио сигналов в формате MP3. Вологдин Э.И. - 7 стр.

UptoLike

Составители: 

7
Чем уже полоса фильтрации, тем ближе PDF к закону Гаусса и применение равно-
мерного квантования становится не эффективным. Поэтому при субполосном кодирова-
нии чаще используется неравномерное квантование, статистически оптимизированное,
при котором шаг квантования зависит от реального распределения плотности вероятно-
сти мгновенных значений звукового сигнала. При этом часто встречающиеся амплитуды
квантуются с меньшим шагом, а редко встречающие с большим. Реализуется неравно-
мерное квантование с использованием адаптации и различных алгоритмов итерации.
Субполосное кодирование позволяет, при необходимости, сокращать скорость циф-
рового потока путем использования психоакустических особенностей слуха человека,
связанные с различным порогом слышимости в разных участках звукового диапазона.
Это реализуется путем вычисления глобального текущего порога слышимости для каж-
дой полосы блока фильтров. Сигналы, уровни которых ниже рассчитанного порога не
квантуются. Слышимый динамический диапазон сигналов всегда существенно меньше
максимально возможного , поэтому для кодирования требуется меньше число разрядов.
Спектральная плотность музыкальных и речевых программ на краях звукового диа-
пазона существенно ниже, чем на средних частотах. Поэтому в этих диапазонах при ис-
пользовании субполосного кодирования можно осуществлять квантование с меньшим
числом разрядов и таким образом сократить скорость цифрового потока.
Из каких соображений выбирается тип двоичного кодирования. Если в кодере число
полос мало, то спектр сигналов в них достаточно широкий, и он сильно отличается от
равномерного. В этом случае предпочтительно кодирование с предсказанием. Чем
больше полос и уже полоса фильтров, тем ближе спектр сигналов к равномерному, и
тогда коэффициент корреляции между выборками стремится к нулю и достаточно ис-
пользовать только энтропийное кодирование, и , в частности, код Хаффмана..
Энтропийное кодирование это кодирование словами (кодами) переменной длины,
при котором длина кода символа имеет обратную зависимость от вероятности появления
символа в передаваемом сообщении. Обычно при энтропийном кодировании используют
для сжатия данных коды, длины которых пропорциональны отрицательному логарифму
вероятности символа. Таким образом, наиболее вероятные символы используют наиболее
короткие коды.
К энтропийному кодированию относятся три больших класса кодов: префиксные ко-
ды, кодирование длин серий и арифметические коды. Энтропийное кодирование эффек-
тивно, когда последовательность кодовых символов имеет случайный характер с распре-
делением по закону Лапласа или Гаусса. Поэтому энтропийному кодированию звуковых
сигналов часто предшествует кодирование с предсказанием, при котором происходит де-
корреляция кодовой последовательности.
Кодирование по Хаффману является примером построения кодов переменной длины,
имеющих минимальную среднюю длину. Этот метод производит идеальное сжатие, то
есть сжимает данные до их энтропии, если вероятности символов точно равны отри-
цательным степеням числа 2. Однако, код Хаффмана обладает очень высокой эффектив-
ностью только при условии, что у формируемого кода переменной длины средняя длина
равна энтропии алфавита. Основное правило построения кодов с переменной длиной
символов очевидно. Короткие коды следует присваивать часто встречающимся символам,
а длинные- редко встречающимся.
Код Хаффмана задается алфавитом
1 2 3
, , ,...
n
A a a a a
- из
n
различных символов с
известной частотой их появления
1 2 3
, , ,...
n
P p p p p
. Под термином «частота» пони-
мается относительная частота событий, их вероятность. Этому алфавиту соответствует
набор двоичных кодовых комбинаций
1 2 3
, , ,...
n
C c c c c
длиной
1 2 3
, , ,...
n
L l l l l
.