Естественно-языковые системы. Евдокимова И.С. - 49 стр.

UptoLike

Составители: 

49
сопоставления. Различаются следующие формы сопоставления: синтаксическое,
параметрическое, семантическое и принуждаемое. Разнообразие форм сопоставления
позволяет анализировать входные предложения, отклоняющиеся от традиционной
грамматики в произвольной степени, однако глубина проникновения в смысл подобных
анализаторов обычно невелика.
Возможности методов анализа, основанных на сопоставлении по образцам, можно
увеличить, используя частичное сопоставление предложения с одним или несколькими
образцами. Примером такой системы может служить Flex-P. Следует отметить, что
возможности частичного сопоставления исследованы мало. Однако бесспорно, что этот
метод анализа весьма эффективен при обработке предложений с отклонениями от
грамматической нормы. Кроме того, сопоставление по образцам позволяет успешно
обрабатывать идиомы. Так как идиомы не могут быть обработаны путем интерпретации
образующих их слов, то для их обработки неизбежно привлечение механизмов, подобных
сопоставлению по образцам. По этой причине некоторые системы, например LUNAR,
основанные на традиционных методах анализа, для обработки идиом включают стадию
преданализа, на которой применяется механизм сопоставления по образцам.
Методы анализа, использующие сопоставление по образцам, имеют определенные
ограничения. Если все предложение сопоставляется с одним образцом, то ясно, что такой
подход не позволяет обеспечить точную обработку сложных предложений. Если
предложение сопоставляется с несколькими образцами, каждый из которых подходит к
отдельному фрагменту предложения, то возникает задача определения границ фрагментов.
Кроме того, после сопоставления фрагментов одного предложения с несколькими образцами
возникает задача получения общей интерпретации всех фрагментов данного предложения.
Анализаторы, использующие разнообразные методы
Все анализаторы, относящиеся к рассмотренным выше классам, основываются на
каком-либо одном методе. Исследования показали, что использование в одном анализаторе
нескольких специфических методов позволяет обеспечить гибкость процесса анализа,
необходимую для обработки неграмматичных конструкций. Примерами таких анализаторов
могут служить CASPAR и MULTIPAR. В настоящее время данный подход еще не получил
такого распространения, как рассмотренные ранее подходы. Это объясняется, на наш взгляд,
его сравнительной новизной и недостаточной исследованностью.
Перейдем к описанию методов анализа связного текста (дискурса). Связность дискурса
достигается как лингвистическими средствами, имеющими языковое выражение, так и
экстралингвистическими (ситуационными) средствами - «умолчаниями», не имеющими
языкового выражения и основанными на общности знаний участников общения о цели
общения и проблемной области. На этапе анализа связного текста, как правило, решается
задача выявления связей между предложениями, выражаемых лингвистическими
средствами, а на этапе интерпретации - ситуационными.
К основным лингвистическим средствам связи предложений относятся ссылки и
эллипсис. В проблеме установления ссылок могут быть выделены две задачи:
сопоставления. Различаются следующие формы сопоставления: синтаксическое,
параметрическое, семантическое и принуждаемое. Разнообразие форм сопоставления
позволяет анализировать входные предложения, отклоняющиеся от традиционной
грамматики в произвольной степени, однако глубина проникновения в смысл подобных
анализаторов обычно невелика.
     Возможности методов анализа, основанных на сопоставлении по образцам, можно
увеличить, используя частичное сопоставление предложения с одним или несколькими
образцами. Примером такой системы может служить Flex-P. Следует отметить, что
возможности частичного сопоставления исследованы мало. Однако бесспорно, что этот
метод анализа весьма эффективен при обработке предложений с отклонениями от
грамматической нормы. Кроме того, сопоставление по образцам позволяет успешно
обрабатывать идиомы. Так как идиомы не могут быть обработаны путем интерпретации
образующих их слов, то для их обработки неизбежно привлечение механизмов, подобных
сопоставлению по образцам. По этой причине некоторые системы, например LUNAR,
основанные на традиционных методах анализа, для обработки идиом включают стадию
преданализа, на которой применяется механизм сопоставления по образцам.
     Методы анализа, использующие сопоставление по образцам, имеют определенные
ограничения. Если все предложение сопоставляется с одним образцом, то ясно, что такой
подход не позволяет обеспечить точную обработку сложных предложений. Если
предложение сопоставляется с несколькими образцами, каждый из которых подходит к
отдельному фрагменту предложения, то возникает задача определения границ фрагментов.
Кроме того, после сопоставления фрагментов одного предложения с несколькими образцами
возникает задача получения общей интерпретации всех фрагментов данного предложения.

     Анализаторы, использующие разнообразные методы
      Все анализаторы, относящиеся к рассмотренным выше классам, основываются на
каком-либо одном методе. Исследования показали, что использование в одном анализаторе
нескольких специфических методов позволяет обеспечить гибкость процесса анализа,
необходимую для обработки неграмматичных конструкций. Примерами таких анализаторов
могут служить CASPAR и MULTIPAR. В настоящее время данный подход еще не получил
такого распространения, как рассмотренные ранее подходы. Это объясняется, на наш взгляд,
его сравнительной новизной и недостаточной исследованностью.
      Перейдем к описанию методов анализа связного текста (дискурса). Связность дискурса
достигается как лингвистическими средствами, имеющими языковое выражение, так и
экстралингвистическими (ситуационными) средствами - «умолчаниями», не имеющими
языкового выражения и основанными на общности знаний участников общения о цели
общения и проблемной области. На этапе анализа связного текста, как правило, решается
задача выявления связей между предложениями, выражаемых лингвистическими
средствами, а на этапе интерпретации - ситуационными.
      К основным лингвистическим средствам связи предложений относятся ссылки и
эллипсис. В проблеме установления ссылок могут быть выделены две задачи:


                                              49