ВУЗ:
Составители:
Рубрика:
Формат продолжает активно развиваться (последняя версия 1.0.4) и в настоящее время, согласно проводи-
мому опросу на форуме hydrogenaudio.org, входит в число трёх наиболее популярных форматов аудиосжатия
без потерь (после Flac и WavPack).
К особенностям данного кодека следует отнести:
– высокая скорость кодирования (ТАК упаковывает аудиоданные с такой же скоростью, как FLAC-8x, в
режиме максимальной компрессии ("Insane") и в несколько раз быстрее в режиме "Turbo");
– высокая скорость декодирования (сопоставимая с FLAC/WavPack);
– очень высокая степень сжатия (на уровне Monkey’s Audio в режиме "High");
– защита от ошибок кодирования;
– быстрый поиск;
– поддержка потокового вещания.
WavPack – бесплатный аудиокодек c открытым исходным кодом для сжатия аудио без потери качества.
WavPack-формат (расширение .WV) позволяет сжимать (и восстанавливать) 8-, 16-, 24- и 32-битные ау-
диофайлы в .WAV формате. Он также поддерживает потоки звук вокруг и высокие частоты дискретизации
(sampling rate). Как у других способов компрессии без потери качества, эффективность сжатия зависит от ис-
ходных данных, но обычно она лежит в диапазоне между 30 и 70 % для обычной популярной музыки, немного
выше для классической музыки и других источников с более широким динамическим диапазоном.
WavPack также включает уникальный "гибридный" режим, который предоставляет все преимущества сжа-
тия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относи-
тельно небольшой файл высокого (точнее, указанного при кодировании) качества с потерей (.WV), который
может проигрываться сам по себе, а также файл "коррекции" (.WVC), который (в комбинации с предыдущим
.WV) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда
не придётся выбирать между сжатием без потерь и с потерей качества.
5.3.2. Сжатие аудиоданных с потерями
Все распространенные потоковые форматы сжатия (MP3, AC3, WMA, OGG) основаны на схожем принци-
пе работы, состоящем из трёх основных этапов.
Первый этап – быстрое преобразование Фурье (FFT) исходного сигнала (фрейма, так как форматы потоко-
вые). Кратко FFT – это процесс, представляющий исходный сигнал в виде суммы синусоид:
F(t) = A1sin(λ1t) + … + Ansin(λnt) + …
Теперь, вместо того чтобы хранить информацию о величине амплитуды волны в каждом сэмпле, остаётся
запомнить только значения амплитуд (Ai) и длин волн (li). Обратное преобразование Фурье для реальных зву-
ков без потери качества невозможно.
Второй этап – психоакустическая обработка, призванная вычистить из звукового потока информацию, не
воспринимаемую человеческим ухом.
И, наконец, третий этап – применение математических алгоритмов сжатия. Во время этой операции происхо-
дят только численные преобразования, позволяющие представить информацию в более компактном виде. В MP3,
например, используется чуть-чуть доработанный алгоритм Хаффмана.
Алгоритм FFT известен сравнительно давно, поэтому разработчики совершенствуют методики сжатия за
счёт оптимизации математического и психоакустических алгоритмов кодирования. Если математический алго-
ритм в каждом формате свой, то основные принципы действия психоакустического алгоритма сжатия схожи и
заимствуют общие идеи у небезызвестного формата MPEG-1 Layer II, разработанного в 1992 году Moving
Picture Experts Group.
Опишем основные положения психоакустики, применяющейся в алгоритмах сжатия звука с потерями.
5.3.2.1. Психоакустика
Психоакустика − наука, изучающая психологические и физиологические особенности восприятия звука
человеком.
Во многих приложениях акустики и обработки звуковых сигналов необходимо знать, что люди слышат.
Звук, который образуют волны давления воздуха, может быть точно измерен современным оборудованием. Од-
нако понять, как эти волны принимаются и отображаются в нашем головном мозге, − задача не такая простая.
Звук – это непрерывный аналоговый сигнал, который (в предположении, что молекулы воздуха бесконечно ма-
лы) может теоретически переносить бесконечное количество информации (может быть бесконечное число час-
тот, содержащих информацию об амплитуде и фазе).
Понимание процессов восприятия позволит учёным и инженерам сосредоточиться на возможностях слуха
и не учитывать менее важные возможности других систем. Важно также отметить, что вопрос "что человек
слышит" – не только вопрос о физиологических возможностях уха, но во многом также вопрос психологии,
чёткости восприятия.
Человеческое ухо номинально слышит звуки в диапазоне 16…20 000 Гц. Верхний предел имеет тенденцию
снижаться с возрастом. Большинство взрослых людей не могут слышать выше 16 кГц. Ухо само по себе не
Страницы
- « первая
- ‹ предыдущая
- …
- 9
- 10
- 11
- 12
- 13
- …
- следующая ›
- последняя »