ВУЗ:
Составители:
23
Кодирование текстовых данных
Если каждому символу алфавита сопоставить определенное целое число
(например, порядковый номер), то с помощью двоичного кода можно кодиро-
вать и текстовую информацию. Восьми двоичных разрядов достаточно для ко-
дирования 256 различных символов. Этого хватит, чтобы выразить различными
комбинациями восьми битов все символы английского и русского алфавитов
как строчные,
так и прописные, а также знаки препинания, символы основных
арифметических действий и некоторые общепринятые специальные символы,
например символ «$».
Для кодирования текстов используются различные таблицы перекодиров-
ки. Важно, чтобы при кодировании и декодировании одного и того же текста
использовалась одна и та же таблица.
Таблица перекодировки – таблица, содержащая упорядоченный некото-
рым образом
перечень кодируемых символов, в соответствии с которым проис-
ходит преобразование символа в его двоичный код и обратно.
Для английского языка, захватившего де-факто нишу международного
средства общения, противоречия уже сняты. Институт стандартизации США
(ANSI – American National Standard Institute) ввел в действие систему кодирова-
ния ASCII (American Standard Code for Information Interchange – стандартный
код информационного обмена США). В системе ASCII закреплены
две таблицы
кодирования: базовая и расширенная. Базовая таблица закрепляет значения ко-
дов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.
Первые 32 кода базовой таблицы, начиная с нулевого, отданы производи-
телям аппаратных средств (в первую очередь, производителям компьютеров и
печатающих устройств). В этой области размещаются так называемые управ
-
ляющие коды, которым не соответствуют никакие символы языков, и, соответ-
ственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими
можно управлять тем, как производится вывод прочих данных.
Начиная с кода 32 по код 127 размещены коды символов английского ал-
фавита, знаков препинания, цифр, арифметических действий и некоторых
вспомогательных символов.
Поддержка производителей оборудования и программ вывела американ-
ский код ASCII на уровень международного стандарта, и национальным систе-
мам кодирования пришлось «отступить» во вторую, расширенную часть систе-
мы кодирования, определяющую значения кодов со 128 по 255. Отсутствие
единого стандарта в этой области привело к множественности одновременно
действующих кодировок. Только в России можно
указать три действующих
стандарта кодировки и еще два устаревших.
Так, например, кодировка символов русского языка, известная как коди-
ровка Windows–1251, была введена «извне» – компанией Microsoft, но, учиты-
вая широкое распространение операционных систем и других продуктов этой
компании в России, она глубоко закрепилась и нашла широкое распростране-
ние. Эта кодировка используется на
большинстве локальных компьютеров, ра-
Страницы
- « первая
- ‹ предыдущая
- …
- 21
- 22
- 23
- 24
- 25
- …
- следующая ›
- последняя »