Компрессирование аудио сигналов в формате MP3. Вологдин Э.И. - 6 стр.

UptoLike

Составители: 

6
всех полосах может быть равна 3 кГц. Что при этом происходит со скоростью выход-
ного цифрового потока.
Для оценки возможности компрессирования цифрового потока при субполосном
кодировании предположим, что на вход кодера подается синусоидальный звуковой сиг-
нал с частотой 1 кГц в виде последовательности 16-ти разрядных выборок с частотой
дискретизации 48 кГц и скоростью цифрового потока 768 Кбит/с. Допустим также , что
используется идеальное неравномерное квантование, при котором сигнал с нулевым
уровнем не квантуется. При этом квантованный сигнал будет только в одной полосе,
соответствующей 1 кГц, и скорость выходного цифрового потока будет равна
16 3000 48000
бит/с, в 16 раз меньше, чем на входе.
Очевидно, что при кодировании звуковой паузы эта скорость сократится до нуля, а
при кодировании сигнала белого шума скорость на выходе будет такая же, как на входе.
При кодировании звуков музыки высокие уровни сигналов могут быть лишь в отдельных
полосах (рис.3), поэтому компрессирование достаточно эффективно. Таким образом, при
субполосном кодировании коэффициент компрессирования зависит от характера звуко-
вых сигналов, это, так называемое, кодирование с переменной скоростью. Коэффициент
компрессирования может быть тем выше, чем больше число полос, так как при этом по-
является возможность уменьшения субполосной частоты дискретизации.
Возможности компрессирования скорости цифрового потока при субполосном коди-
ровании реализуется в формате MP3 в так называемом режиме с переменной скоростью
VBR( variable bit rate). Этот режим является самым прогрессивным и до сих пор развива-
ется и улучшается, так как аудиоматериал разной насыщенности может быть закодирован
с определѐнным качеством, которое обычно выше, чем при установке среднего значения
скорости цифрового потока в режиме CBR( constant bit rate). Плюс к тому, размер файла
уменьшается за счѐт музыкальных фрагментов, не требующих высокого битрейта.
Из каких соображений выбирается метод квантования. Для этого выбора крайне
важны статистические характеристики звуковых сигналов. Из классической теории сигна-
лов известно, что значения выборок, взятых через интервал Котельникова, взаимно некор-
релированы, если спектр сигнала в занимаемой им полосе частот равномерен (белый шум).
Однако на практике спектр звуковых сигналов далеко неравномерен, поэтому корреляция
между выборками не равна нулю. При этом степень корреляции возрастает с увеличени-
ем частоты дискретизации. Типичным примером таких сигналов является речь, где кор-
реляция между соседними выборками достаточно велика при соблюдении требований
теоремы Котельникова в процессе дискретизации.
Равномерное квантование является оптимальным в смысле минимизации средне-
квадратической ошибки квантования для сигналов равномерной плотностью вероятно-
стей распределения мгновенных значений (PDF) звуковых сигналов. Оно используется
при достаточно широкой полосе фильтров. При неравномерном квантовании для сигна-
лов малого уровня используется число уровней квантования меньше, а для высокого
уровня - больше.
Рис.3. Сигналы на выходе полосовых фильтров