Введение в цифровую обработку изображений. Филатов А.К. - 29 стр.

UptoLike

Составители: 

29
(LZW-кодирование), используется другой подход. Давайте статистически про-
анализируем информацию предыдущего абзаца, разбив его вначале на две час-
ти, соответствующие входящим в него предложениям:
"Граница применимости этой схемы сжатия очевидна: данные можно
сжимать, только если отдельные элементы данных различаются по частоте
встречаемости"
"Если же элементы данных распределены статистически равномерно, то
сжатие невозможно"
Очевидно, во втором предложении содержится несколько последова-
тельностей букв (по меньшей мере, из двух букв), которые можно обнаружить
и в первом предложении. Эти последовательности второго предложения под-
черкнуты. Наверное, имеется еще больше совпадений, которые сразу не бро-
саются в глаза. Тем не менее 39 из 83 знаков второго предложения можно счи-
тать избыточными. На этом основана схема сжатия. Сначала часть текста пе-
редается без сжатия, а далее следуют либо другие несжатые последовательно-
сти, либо данные, которые указывают, где можно найти некоторую последова-
тельность знаков в уже переданном тексте. Если снова произвести загрузку та-
кого файла, то программа восстановления отыскивает подобные последова-
тельности знаков и вводит их вместо так называемых офсетных данных (отно-
сительных адресов). Все доступные в настоящее время программы сжатия без
потерь, включая PKZIP, RAR, ARC, и т.п., используют различные реализации
описанного метода. Они сжимают информацию с учетом уже переданных дан-
ных. Поскольку переданные данные образуют своего рода постоянно просмат-
риваемый словарь, метод сжатия называют "методом на основе словаря", либо
из признательности к Зиву, Лемпелю и Велчу – "LZW-кодированием".
В некоторых изображениях в виде битовых матриц встречается прямое
повторение значений цвета. Типичными примерами являются так называемые
"распечатки с экрана" (screenshots или screendumps) и простые рисунки в виде
битовых матриц, которые содержат лишь небольшое количество цветов. С по-
мощью метода кодирования длин серий (RLE) такие изображения можно за-
поминать, значительно экономя емкость памяти. При кодировании длин серий
программа в процессе запоминания ищет повторяющиеся значения цвета. Если
значения цвета повторяются, в файле запоминаются два числа. Первое число
указывает, сколько раз повторяется данный цвет, а второе число соответствует
значению цвета. При этом методе видеоданные также проверяются на избы-
точность. В PCX-файлах данные принципиально запоминаются с использова-
нием кодирования длин серий. При необходимости кодирование длин серий
может использоваться в BMP- и Targa-файлах.
Насколько эффективно можно сжимать видеоданные методами без по-
терь? До сих пор нам встречались четыре типа изображений, а именно, черно-
белые, полутоновые, палитровые и истинно-цветные (True Color) изображения.