Прикладные протоколы Интернет и WWW. Чукарин А.В. - 100 стр.

UptoLike

Составители: 

© Чукарин А.В., 2006
100
документы одного и того же типа могут обрабатываться одинаковым
образом. Можно конструировать программы, использующие знание
структуры документа, которые, таким образом, могут действовать в
более осмысленной манере.
Независимость данных
Основная цель создания SGML заключалась в том, чтобы
обеспечить транспортабельность закодированных документов из одной
аппаратной и программной среды в другую без потери информации.
Два описанных выше свойства решают эту задачу на абстрактном
уровне; третье свойствона уровне строк байтов (символов), из которых
составляется документ. SGML предоставляет универсальный механизм
строковой подстановки (string substitution), т.е., простой машинно-
независимый способ обозначить, что некоторая последовательность
символов в документе должна заменяться при его обработке некоторой
другой последовательностью. Одно очевидное применение этого
механизма обеспечение согласованности номенклатуры; другое, и
более важное, - противодействие печально известной неспособности
различных компьютерных систем понимать наборы символов друг
друга, или способ в любой системе предоставить все графические
символы, необходимые для конкретного приложения, путем
использования описательных обозначений непереносимых символов.
Строки, определенные этим механизмом подстановки, называются
объектами (entities).
10.2.3. Структура текста
Текст не является просто однородной последовательностью
слов, или, тем более, байтов. Для различных целей он может быть
разделен на множество разных единиц разных типов или размеров.
Текст в прозе, такой, как этот, можно разделить на разделы, главы,
абзацы и предложения. Стихотворный текст можно делить на песни,
строфы и строки. Будучи напечатанным, и проза, и поэзия может
делиться на тома, сборники, страницы.
Такого рода структурные единицы чаще всего используют для
идентификации конкретной позиции или ссылки внутри текста
третье предложение второго абзаца десятой главы»; «песнь 10,
строка 1234»; «страница 412» и т.п.), но они могут также применяться
для деления текста на осмысленные сегменты для аналитических целей
отличаются ли средние длины предложений раздела 2 и раздела 5?»;
«сколько абзацев разделяют появления слова природа?»; «сколько в