Программные методы защиты информации. Часть 1. Крыжановская Ю.А. - 18 стр.

UptoLike

Составители: 

18
них , по сегодняшним меркам , слишком маленький коэффициент архивации. Ис-
пользуя один из алгоритмов сжатия без потерь, можно обеспечить архивацию
изображения примерно в два раза. В то же время алгоритмы сжатия с потерями
оперируют гораздо большими коэффициентами.
Сжатие с потерями можно рассматривать как необратимое. Под необрати-
мым сжатием подразумевают такое преобразование входного потока данных, при
котором выходной поток, основанный на определенном формате информации,
представляет, с некоторой точки зрения , достаточно похожий по внешним харак -
теристикам на входной поток объект, однако отличается от него объемом.
Степень сходства входного и выходного потоков определяется степенью
соответствия некоторых свойств объекта (т.е. сжатой и несжатой информации в
соответствии с некоторым определенным форматом данных), представляемого
данным потоком информации.
Такие подходы и алгоритмы используются для сжатия , например, данных
растровых графических файлов с низкой степенью повторяемости байтов в пото -
ке. В этом случае используется свойство структуры формата графического файла
и возможность представить графическую картинку приблизительно схожую по
качеству отображения (для восприятия человеческим глазом ) несколькими спо-
собами. Поэтому, кроме степени или величины сжатия , в таких алгоритмах воз-
никает понятие качества, т.к. исходное изображение в процессе сжатия изменяет-
ся , то под качеством можно понимать степень соответствия исходного и резуль-
тирующего изображения , оцениваемую субъективно , исходя из формата инфор-
мации. Для графических файлов такое соответствие определяется визуально , хо-
тя имеются и соответствующие интеллектуальные алгоритмы и программы. Не-
обратимое сжатие невозможно применять в областях, в которых необходимо
иметь точное соответствие информационной структуры входного и выходного
потоков . Данный подход реализован в популярных форматах представления ви-
део и фото информации, известных как JPEG и GIF алгоритмы и JPG и GIF
форматы файлов .
Главный принцип , лежащий в основе всех алгоритмов архивации, - устра-
нить из "сжимаемого" текста избыточность . Под избыточностью обычно понима-
ются части текста, не несущие никакой информации для воспринимающего объ-
екта. Строго понятие избыточности можно определить следующим образом :
Если какой-либо текст состоит из знаков , каждый из которых может при-
нимать q значений , и каждый знак содержит Н битов информации, то избыточно -
стью текста называется величина R = 1 H / log
2
(q).
Рассмотрим несколько альтернативных способов кодировки.
Табличная кодировка
Рассмотрим текст : "ЗАЩИТА ПРОГРАММ И ДАННЫХ ОТ НСД ". При
размещении в оперативной памяти ЭВМ данный текст занимает 31 байт. Это , ко-
нечно , только в том случае , если для его кодировки используется стандартная
копировочная таблица ASCII. Однако в случае вышеприведенного текста при
стандартной кодировке многие биты байта не несут никакой информации и, по-
просту говоря, не используются . В исходном тексте 16 различных символов .
Значит, для кодировки каждого символа достаточно 4 бит. Например:
                                      18
них, по сегодняшним меркам, слишком маленький коэффициент архивации. Ис-
пользуя один из алгоритмов сжатия без потерь, можно обеспечить архивацию
изображения примерно в два раза. В то же время алгоритмы сжатия с потерями
оперируют гораздо большими коэффициентами.
      Сжатие с потерями можно рассматривать как необратимое. Под необрати-
мым сжатием подразумевают такое преобразование входного потока данных, при
котором выходной поток, основанный на определенном формате информации,
представляет, с некоторой точки зрения, достаточно похожий по внешним харак-
теристикам на входной поток объект, однако отличается от него объемом.
      Степень сходства входного и выходного потоков определяется степенью
соответствия некоторых свойств объекта (т.е. сжатой и несжатой информации в
соответствии с некоторым определенным форматом данных), представляемого
данным потоком информации.
      Такие подходы и алгоритмы используются для сжатия, например, данных
растровых графических файлов с низкой степенью повторяемости байтов в пото-
ке. В этом случае используется свойство структуры формата графического файла
и возможность представить графическую картинку приблизительно схожую по
качеству отображения (для восприятия человеческим глазом) несколькими спо-
собами. Поэтому, кроме степени или величины сжатия, в таких алгоритмах воз-
никает понятие качества, т.к. исходное изображение в процессе сжатия изменяет-
ся, то под качеством можно понимать степень соответствия исходного и резуль-
тирующего изображения, оцениваемую субъективно, исходя из формата инфор-
мации. Для графических файлов такое соответствие определяется визуально, хо-
тя имеются и соответствующие интеллектуальные алгоритмы и программы. Не-
обратимое сжатие невозможно применять в областях, в которых необходимо
иметь точное соответствие информационной структуры входного и выходного
потоков. Данный подход реализован в популярных форматах представления ви-
део и фото информации, известных как JPEG и GIF алгоритмы и JPG и GIF
форматы файлов.
      Главный принцип, лежащий в основе всех алгоритмов архивации, - устра-
нить из "сжимаемого" текста избыточность. Под избыточностью обычно понима-
ются части текста, не несущие никакой информации для воспринимающего объ-
екта. Строго понятие избыточности можно определить следующим образом:
      Если какой-либо текст состоит из знаков, каждый из которых может при-
нимать q значений, и каждый знак содержит Н битов информации, то избыточно-
стью текста называется величина R = 1 – H / log2 (q).
      Рассмотрим несколько альтернативных способов кодировки.
Табличная кодировка
     Рассмотрим текст: "ЗАЩИТА ПРОГРАММ И ДАННЫХ ОТ НСД". При
размещении в оперативной памяти ЭВМ данный текст занимает 31 байт. Это, ко-
нечно, только в том случае, если для его кодировки используется стандартная
копировочная таблица ASCII. Однако в случае вышеприведенного текста при
стандартной кодировке многие биты байта не несут никакой информации и, по-
просту говоря, не используются. В исходном тексте 16 различных символов.
Значит, для кодировки каждого символа достаточно 4 бит. Например: