ВУЗ:
Составители:
Рубрика:
щаяся в подобных документах, неоднородна. Газета содержит заголовки раз-
личных уровней, сноски, подписи к фотографиям и т. п. Конверт письма несет
информацию об адресе отправителя и получателя. Разделение информации на
различные типы и какоелибо выделение этих типов дает нам возможность бо-
лее тонкой обработки документа, чем просто его создание и удаление. Если
представить себе книгу без оглавления, в которой отсутствуют абзацы, и весь
текст, включая заголовки, набран одним и тем же шрифтом, то становится по-
нятным, что наличие даже простейшей структуры в документе придает ему
значительную гибкость в обработке.
Рассматривая в качестве примера такие документы, как письмо, мы исхо-
дили из того, что работать с ними предстоит человеку. Но если поручить их об-
работку компьютеру, т. е. коснуться электронных документов, то интуитивно
понятной структуры здесь уже недостаточно. Для однозначного определения
адреса здесь необходимо четко указать название города, улицы, номера дома и
квартиры. Таким образом, должны существовать однозначные обозначения для
соответствующих групп символов.
Теперь мы уже можем говорить о документе как о последовательности
символов, некоторые группы которых выделены, т. е. интерпретируются осо-
бым образом, в зависимости от способа их выделения или, иными словами, от
того, как они обозначены. Но и сейчас еще рано говорить о жесткой структуре
документа. Помечая различные слова или части текста, мы ничего не сказали о
том, как они должны интерпретироваться в зависимости от их местоположения
в тексте или относительно друг друга. Возникающую в этой ситуации неодно-
значность можно проиллюстрировать следующими двумя примерами.
Если в тексте присутствуют заголовки различной степени вложенности,
то для их пометки как заголовков потребуются различные обозначения, причем
для заголовка каждого уровня вложенности понадобится отдельное обозначе-
ние. Если воспользоваться одним обозначением для всех заголовков, то необ-
ходимо будет задать такие правила обработки этого обозначения, которые учи-
тывали бы место вхождения обозначения относительно других его вхождений.
Иначе интерпретатор текста не сможет определить для себя степень вложенно-
сти заголовков, и все они будут отображены одинаково.
Второй пример заключается в обработке омонимов — слов, которые мо-
гут иметь несколько значений в зависимости от контекста. Пример омонима —
слово «коса». Оно может означать речную косу, женскую прическу и сельско-
хозяйственное орудие. В документах чаще всего встречаются омонимы другого
рода, когда одно и то же слово используется непосредственно по своему значе-
нию и как имя собственное. Например, слово «труд» может быть названием га-
зеты и нарицательным именем. Для того чтобы избавится от неоднозначности,
мы, как и в первом примере, можем ввести для каждого смысла омонима уни-
кальное обозначение и использовать его при каждом вхождении этого омонима
во всем тексте. Или же мы можем описать правила интерпретации одного един-
ственного обозначения, зависящие от местоположения омонима в этом тексте.
Правило может быть, например, таким: если слово "труд" встречается в самом
34
Страницы
- « первая
- ‹ предыдущая
- …
- 32
- 33
- 34
- 35
- 36
- …
- следующая ›
- последняя »
