Естественно-языковые системы. Евдокимова И.С. - 22 стр.

UptoLike

Составители: 

22
Однако помимо функционально полных систем ведется интенсивная разработка систем,
которые можно назвать фрагментарными. Цель их создания - исследование или реализация
новых методов решения достаточно узких задач (например таких, как анализ, интерпретация,
определение целей пользователя и т. п.).
Благодаря модульности структуры ЕЯ-систем и, как правило, универсальному (т. е. не
зависящему от специфики прикладных областей) характеру языка внутреннего
представления, фрагментарные системы могут успешно использоваться в качестве
отдельных функциональных блоков, встраиваемых (хотя бы на логическом уровне) в
различные функционально полные ЕЯ-системы. Рассмотрим основные отличительные
характеристики каждого класса ЕЯ-систем на примере существующих систем.
Интеллектуальные вопрос-ответные системы
При разработке интеллектуальных вопрос-ответных систем основное внимание
уделяется языковому аспекту, т. е. максимальному приближению языка общения к
литературному естественному языку. Наиболее значительной из отечественных систем
данного класса является система ПОЭТ, созданная коллективом исследователей под
руководством Э.В. Попова, во многом определившая применяемые в последующих системах
методы анализа и генерации высказываний на русском языке.
Система ПОЭТ воспринимает вопросительные предложения русского языка с
практически несущественными ограничениями на допустимые синтаксические конструкции
и пунктуацию. Типичными примерами запросов, допускаемых системой ПОЭТ, могут
служить «Сколько каменного угля перевезено железнодорожным транспортом в 1978 году
или «Каков удельный вес перевозок железнодорожным транспортом в общем объеме
перевозок всеми видами транспорта в 1975 году
Процесс понимания входных высказываний осуществляется в системе ПОЭТ по
полной схеме: морфологический анализ, синтаксический анализ, семантический анализ и
семантическая интерпретация (рис. 4). При этом последние три этапа выполняются в общем
случае параллельно, за счет чего достигается коррекция неверных путей анализа, и в
конечном счете сокращается время обработки запросов.
Все знания о языке общения разделяются в системе ПОЭТ на лингвистические и
проблемные. Первые хранятся в различных зонах словаря (морфологической и синтактико-
семантической), а вторые - в семантической сети. При этом в системе различаются
абстрактная (описывающая общие понятия и категории) и конкретная (описывающая
конкретные сущности) семантические сети. Описания базовых событий представлены в
словаре системы в виде моделей управления. Выделение участников событий и определение
выполняемых ими ролей осуществляются на основе метода фильтров. При этом активно
используется как грамматическая, так и синтактико-семантическая информация.
На этапе семантического анализа синтаксическая структура входного высказывания,
представленная в виде дерева зависимостей, преобразуется в семантический граф, состоящий
из вершин-понятий, связанных друг с другом через вершины-события и характеристики.
Каждая вершина семантического графа определяется каноническим представлением, а дуги
Однако помимо функционально полных систем ведется интенсивная разработка систем,
которые можно назвать фрагментарными. Цель их создания - исследование или реализация
новых методов решения достаточно узких задач (например таких, как анализ, интерпретация,
определение целей пользователя и т. п.).
     Благодаря модульности структуры ЕЯ-систем и, как правило, универсальному (т. е. не
зависящему от специфики прикладных областей) характеру языка внутреннего
представления, фрагментарные системы могут успешно использоваться в качестве
отдельных функциональных блоков, встраиваемых (хотя бы на логическом уровне) в
различные функционально полные ЕЯ-системы. Рассмотрим основные отличительные
характеристики каждого класса ЕЯ-систем на примере существующих систем.

Интеллектуальные вопрос-ответные системы
     При разработке интеллектуальных вопрос-ответных систем основное внимание
уделяется языковому аспекту, т. е. максимальному приближению языка общения к
литературному естественному языку. Наиболее значительной из отечественных систем
данного класса является система ПОЭТ, созданная коллективом исследователей под
руководством Э.В. Попова, во многом определившая применяемые в последующих системах
методы анализа и генерации высказываний на русском языке.
     Система ПОЭТ воспринимает вопросительные предложения русского языка с
практически несущественными ограничениями на допустимые синтаксические конструкции
и пунктуацию. Типичными примерами запросов, допускаемых системой ПОЭТ, могут
служить «Сколько каменного угля перевезено железнодорожным транспортом в 1978 году?»
или «Каков удельный вес перевозок железнодорожным транспортом в общем объеме
перевозок всеми видами транспорта в 1975 году?»
     Процесс понимания входных высказываний осуществляется в системе ПОЭТ по
полной схеме: морфологический анализ, синтаксический анализ, семантический анализ и
семантическая интерпретация (рис. 4). При этом последние три этапа выполняются в общем
случае параллельно, за счет чего достигается коррекция неверных путей анализа, и в
конечном счете сокращается время обработки запросов.
     Все знания о языке общения разделяются в системе ПОЭТ на лингвистические и
проблемные. Первые хранятся в различных зонах словаря (морфологической и синтактико-
семантической), а вторые - в семантической сети. При этом в системе различаются
абстрактная (описывающая общие понятия и категории) и конкретная (описывающая
конкретные сущности) семантические сети. Описания базовых событий представлены в
словаре системы в виде моделей управления. Выделение участников событий и определение
выполняемых ими ролей осуществляются на основе метода фильтров. При этом активно
используется как грамматическая, так и синтактико-семантическая информация.
     На этапе семантического анализа синтаксическая структура входного высказывания,
представленная в виде дерева зависимостей, преобразуется в семантический граф, состоящий
из вершин-понятий, связанных друг с другом через вершины-события и характеристики.
Каждая вершина семантического графа определяется каноническим представлением, а дуги


                                            22