Компьютерный практикум по цифровой аудиотехнике. Вологдин Э.И. - 77 стр.

UptoLike

Составители: 

Рубрика: 

77
преобразователя. Исходный аналоговый звуковой сигнал формируется на выходе
сумматора.
При субполосном кодировании осуществляется перенос звукового сигнала из
временной в спектральную область и при этом кодируется не сигнал, а его спектр. Чем
больше спектральных полос
n
, тем точнее осуществляется это преобразование и тем
выше может быть компрессия. В субполосном декодере происходит обратное
преобразование сигналов из спектральной области во временную область.
Субполосное кодирование позволяет в каждой полосе использовать минимальное
число разрядов, вплоть до нуля, обеспечивающих необходимое отношение сигнал/шум .
Максимальная компрессия в таком кодере достигается в случае кодирования тональных
сигналов, так как при этом сигнал присутствует только в одной полосе и поэтому скорость
цифрового потока сокращается в
n
раз.
Компрессия минимальна при кодировании сигналов белого шума. В этом случае
уровень сигнала во всех полосах одинаковый и определяется спектральной плотностью
шума, которая на 43 дБ ниже уровня сигнала на входе кодера. Это значит, что в каждой
полосе число используемых разрядов может быть сокращено на 7 бит.
Выбор частоты дискретизации при кодировании в частотной области основывается
на том, что максимальная частота спектра огибающей звукового сигнала в функции
времени
max
F
и ширина полосы пропускания фильтра
F
связаны неравенством
max
1
F
F
Из этого неравенства следует, что частота дискретизации в частотной области
si
f
должна, по крайней мере, вдвое превышать полосу фильтрации
2
si i
fF
Так, например, если звуковой диапазон от 0 до частоты Найквиста разбивается на 16
полос шириной по 1500 Гц, то минимальная частота дискретизации звуковых сигналов во
всех полосах может быть равна 3 кГц.
Перцептуальное кодирование на рис.7.2 осуществляется с помощью блока
вычисления порога слышимости. Он включает в себя анализатор спектра FFT и
вычислительный блок, рассчитывающий трехмерный (амплитуда, частота и время) так
называемый глобальный порог слышимости TH. Сигналы с этого блока управляют
коэффициентом передачи фильтров субполосного кодера таким образом, что в полосах, в
которых уровень сигналов меньше порога слышимости, далее по тракту не передаются.
Благодаря этому и достигается значительное сокращение скорости цифрового потока.
Глобальный порог слышимости определяется абсолютным порогом и эффектами
маскировки тона тоном, тона шумом или шума тоном. В случае использования тестовых
тональных и шумовых сигналов глобальный порог слышимости тождественен
абсолютному порогу, и он определяет частотную характеристику кодека, поэтому она и
зависит от уровня тестовых сигналов.
На рис. 7.3 приведен стандартный график абсолютного порога слышимости, из
которого видно, что этот порог при малых уровнях звука приводит к достаточно
сильному уменьшению полосы пропускания компрессируемого сигнала. Так при уровне
звука 80 dB SPL слышимый диапазон простирается от 20 до 20000 Гц, а при его уровне
10 dB SPL этот диапазон равен 250…10000 Гц. Динамический диапазон сигналов (DR) в
стандарте MPEG-1 рассчитывается в шкале FS, в которой за 0 дБ принят уровень
звукового давления 96 дБ SPL.
В формате MPEG-1 Layer 2 используется линейное квантование и линейное двоичное
кодирование с итерацией. В формате MPEG-1 Layer 3 используется нелинейное
квантование и энтропийное кодирование с итерацией на основе кода Хаффмана,