ВУЗ:
Составители:
18
них , по сегодняшним меркам , слишком маленький коэффициент архивации. Ис-
пользуя один из алгоритмов сжатия без потерь, можно обеспечить архивацию
изображения примерно в два раза. В то же время алгоритмы сжатия с потерями
оперируют гораздо большими коэффициентами.
Сжатие с потерями можно рассматривать как необратимое. Под необрати-
мым сжатием подразумевают такое преобразование входного потока данных, при
котором выходной поток, основанный на определенном формате информации,
представляет, с некоторой точки зрения , достаточно похожий по внешним харак -
теристикам на входной поток объект, однако отличается от него объемом.
Степень сходства входного и выходного потоков определяется степенью
соответствия некоторых свойств объекта (т.е. сжатой и несжатой информации в
соответствии с некоторым определенным форматом данных), представляемого
данным потоком информации.
Такие подходы и алгоритмы используются для сжатия , например, данных
растровых графических файлов с низкой степенью повторяемости байтов в пото -
ке. В этом случае используется свойство структуры формата графического файла
и возможность представить графическую картинку приблизительно схожую по
качеству отображения (для восприятия человеческим глазом ) несколькими спо-
собами. Поэтому, кроме степени или величины сжатия , в таких алгоритмах воз-
никает понятие качества, т.к. исходное изображение в процессе сжатия изменяет-
ся , то под качеством можно понимать степень соответствия исходного и резуль-
тирующего изображения , оцениваемую субъективно , исходя из формата инфор-
мации. Для графических файлов такое соответствие определяется визуально , хо-
тя имеются и соответствующие интеллектуальные алгоритмы и программы. Не-
обратимое сжатие невозможно применять в областях, в которых необходимо
иметь точное соответствие информационной структуры входного и выходного
потоков . Данный подход реализован в популярных форматах представления ви-
део и фото информации, известных как JPEG и GIF алгоритмы и JPG и GIF
форматы файлов .
Главный принцип , лежащий в основе всех алгоритмов архивации, - устра-
нить из "сжимаемого" текста избыточность . Под избыточностью обычно понима-
ются части текста, не несущие никакой информации для воспринимающего объ-
екта. Строго понятие избыточности можно определить следующим образом :
Если какой-либо текст состоит из знаков , каждый из которых может при-
нимать q значений , и каждый знак содержит Н битов информации, то избыточно -
стью текста называется величина R = 1 – H / log
2
(q).
Рассмотрим несколько альтернативных способов кодировки.
Табличная кодировка
Рассмотрим текст : "ЗАЩИТА ПРОГРАММ И ДАННЫХ ОТ НСД ". При
размещении в оперативной памяти ЭВМ данный текст занимает 31 байт. Это , ко-
нечно , только в том случае , если для его кодировки используется стандартная
копировочная таблица ASCII. Однако в случае вышеприведенного текста при
стандартной кодировке многие биты байта не несут никакой информации и, по-
просту говоря, не используются . В исходном тексте 16 различных символов .
Значит, для кодировки каждого символа достаточно 4 бит. Например:
18 них, по сегодняшним меркам, слишком маленький коэффициент архивации. Ис- пользуя один из алгоритмов сжатия без потерь, можно обеспечить архивацию изображения примерно в два раза. В то же время алгоритмы сжатия с потерями оперируют гораздо большими коэффициентами. Сжатие с потерями можно рассматривать как необратимое. Под необрати- мым сжатием подразумевают такое преобразование входного потока данных, при котором выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним харак- теристикам на входной поток объект, однако отличается от него объемом. Степень сходства входного и выходного потоков определяется степенью соответствия некоторых свойств объекта (т.е. сжатой и несжатой информации в соответствии с некоторым определенным форматом данных), представляемого данным потоком информации. Такие подходы и алгоритмы используются для сжатия, например, данных растровых графических файлов с низкой степенью повторяемости байтов в пото- ке. В этом случае используется свойство структуры формата графического файла и возможность представить графическую картинку приблизительно схожую по качеству отображения (для восприятия человеческим глазом) несколькими спо- собами. Поэтому, кроме степени или величины сжатия, в таких алгоритмах воз- никает понятие качества, т.к. исходное изображение в процессе сжатия изменяет- ся, то под качеством можно понимать степень соответствия исходного и резуль- тирующего изображения, оцениваемую субъективно, исходя из формата инфор- мации. Для графических файлов такое соответствие определяется визуально, хо- тя имеются и соответствующие интеллектуальные алгоритмы и программы. Не- обратимое сжатие невозможно применять в областях, в которых необходимо иметь точное соответствие информационной структуры входного и выходного потоков. Данный подход реализован в популярных форматах представления ви- део и фото информации, известных как JPEG и GIF алгоритмы и JPG и GIF форматы файлов. Главный принцип, лежащий в основе всех алгоритмов архивации, - устра- нить из "сжимаемого" текста избыточность. Под избыточностью обычно понима- ются части текста, не несущие никакой информации для воспринимающего объ- екта. Строго понятие избыточности можно определить следующим образом: Если какой-либо текст состоит из знаков, каждый из которых может при- нимать q значений, и каждый знак содержит Н битов информации, то избыточно- стью текста называется величина R = 1 – H / log2 (q). Рассмотрим несколько альтернативных способов кодировки. Табличная кодировка Рассмотрим текст: "ЗАЩИТА ПРОГРАММ И ДАННЫХ ОТ НСД". При размещении в оперативной памяти ЭВМ данный текст занимает 31 байт. Это, ко- нечно, только в том случае, если для его кодировки используется стандартная копировочная таблица ASCII. Однако в случае вышеприведенного текста при стандартной кодировке многие биты байта не несут никакой информации и, по- просту говоря, не используются. В исходном тексте 16 различных символов. Значит, для кодировки каждого символа достаточно 4 бит. Например:
Страницы
- « первая
- ‹ предыдущая
- …
- 16
- 17
- 18
- 19
- 20
- …
- следующая ›
- последняя »