Мультимедийные технологии в САПР. Часть II. Майстренко Н.В - 28 стр.

UptoLike

Ни один из перечисленных вопросы стандартом не регламентируются, оставляя свободу для построения
собственных оптимальных алгоритмов.
Н.263. Данный стандарт является расширением, дополнением и значительным усложнением Н.261. Он со-
держит "базовый" стандарт кодирования, практически не отличающийся по алгоритмам сжатия от Н.261, плюс
множество опциональных его расширений.
Перечислим наиболее важные отличия.
1. Использование арифметического кодирования вместо кодов Хаффмана. Даёт возможность на 5…10 %
повысить степень сжатия.
2. Возможность задания векторов смещения, указывающих за границы изображения. При этом граничные
пикселы используются для предсказания пикселов вне изображения. Данный приём усложняет алгоритм деко-
дирования, но позволяет значительно улучшить изображение при резкой смене плана сцены.
3. Возможность задания вектора смещения для каждого блока 8 × 8 в макроблоке, что в ряде случаев су-
щественно увеличивает сжатие и снижает блочность изображения.
4. Появление В-кадров, которые позволяют увеличить степень сжатия за счёт усложнения и увеличения
времени работы декодера.
5. Поддержка большого числа форматов входных видеоданных: sub-QCIF, QCIF, CIF, 4CIF, 16CIF и от-
дельно настраиваемых. Основное отличие от более универсальных форматов заключается в адаптации для не-
скольких фиксированных разрешений, что позволяет делать менее универсальные, но более быстрые процеду-
ры обработки кадров. Построенный таким образом декодер работает несколько быстрее.
6. Компенсация движения с субпиксельной точностью. Возможность сдвинуть блок на полпиксела также
увеличивает степень сжатия, но увеличивает время работы декодера. Особый режим сжатия INTRA макробло-
ков со ссылкой на соседние макроблоки в обрабатываемом кадре, особый режим квантования и специальная
таблица Хаффмана для улучшения сжатия I-кадров в ряде случаев.
7. Сглаживание границ блоков декодированного изображения для уменьшения эффекта "блочности". За-
частую при резком движении в кадре при сжатии алгоритм оказывается вынужден повысить степень квантова-
ния блоков после ДКП, чтобы уложиться в отведённый на передачу битовый поток. При этом в кадре возника-
ют хорошо знакомые по JPEG блоки размером 8x8. Как показала практика, "сращивание" границ, когда крайние
пикселы блоков сдвигают по яркости так, чтобы уменьшить разницу, позволяет зачастую заметно повысить
визуальное качество фильма. Изменение разрешения и деформирование базового кадра, использующегося в
качестве базового при сжатии.
8. Различные режимы квантования и кодирования по Хаффману.
MPEG-2 сжимает оцифрованное видео при потоке данных от 3 до
10 Мбит/с. Многое в нём заимствовано из формата CCIR-601. CCIR-601 представляет собой стандарт цифрово-
го видео с размером передаваемого изображения 720 × 486 при 60 полукадрах в секунду. Строки изображения
передаются с чередованием, и два полукадра составляют кадр. Этот приём нередко применяют для уменьшения
мерцания.
Хроматические каналы (U и V в YUV) передаются размером 360 × 243 60 раз в секунду и также чередуются,
уже между собой. Подобное деление называется 4:2:2. Перевод из CCIR-601 в MPEG-I прост: делится в 2 раза
яркостная компонента по горизонтали, делится поток в 2 раза во временном измерении (убрав чередование),
добавляется вторая хроматическая компонента и удаляются "лишние" строки, чтобы размер по вертикали де-
лился на 16. Получается поток YUV кадров размером 352 × 240 с частотой 30 кадров в секунду.
Если же необходимо довести качество изображения до CCIR-601, то, чтобы исключить размывание объек-
та и артефакты, применяют деинтерлейсинг и архивацию чётных и нечётных кадров в потоке CCIR-601 незави-
симо. Конечно, потери степени сжатия здесь неизбежны.
MPEG-4 кардинально отличается от принимаемых ранее стандартов.
Рассмотрим наиболее интересные и полезные нововведения.
1. Расчёт трёхмерных сцен и работа с синтетическими объектами.
В состав декодера MPEG-4 как составная часть входит блок визуализации трёхмерных объектов (Animation
Framework extension (AFX) – то, что в просторечии называют данными для трёхмерного движка). Те, кто коди-
ровал видео, знают, сколько проблем доставляют титры и вообще любые накладываемые поверх фильма объек-
ты (логотипы, заставки и т.п.).
В MPEG-4 предлагается накладываемые объекты рассчитывать от-
дельно и затем накладывать. Кроме того, можно использовать видеопоток даже как текстуру, накладываемую на
поверхности рассчитываемых объек-
тов. Такая гибкая работа с трёхмерными объектами позволяет существенно поднять степень сжатия при замет-
но лучшем качестве изображения. Более того, никто не мешает делать видеоролики вообще без живого видео, а
состоящие только из рассчитанных (синтетических) объектов. Размер их описания будет в разы меньше, чем
размер аналогичных фильмов, сжатых просто как поток кадров. Кстати, отдельно в стандарте предусмотрена
работа со "спрайтами" – статическими изображениями, накладываемыми на кадр. При этом размер спрайта мо-
жет быть как совсем маленький (логотип канала в уголке экрана), так и превышать размер кадра и "прокручи-
ваться". Это даёт значительную гибкость при создании MPEG-4-фильмов и позволяет заметно уменьшить объ-
ём кодируемой информации.