Естественно-языковые системы. Евдокимова И.С. - 30 стр.

UptoLike

Составители: 

30
отобразить дерево синтаксического разбора в следующий запрос к базе данных:
SELECT (student) WHERE group="630".
Рис. 7. Дерево синтаксического разбора
Отображение дерева в выражение запроса производится с помощью правил, и целиком
основывается на синтаксической информации дерева разбора. Правила отображения могут
быть следующими:
"какие" отображается в SELECT;
"студент" отображается в student;
"группа" отображается в group;
поддерево NT отображается в N="T" (в нашем примере будет group="630");
поддерево NP отображается в det(N) (SELECT (student));
поддерево VP отображается в WHERE NT (WHERE group="630");
S отображается в NP and VP (SELECT (student) WHERE group="630").
Обычно трудно составить систему правил, трансформирующих дерево разбора
напрямую в некоторое выражение на языке запросов к реальным базам данных (например,
SQL), поэтому данный подход применятся в основном в комбинации с другими.
Семантически-ориентированный метод анализа ЕЯ-запросов был предложен А.С.
Нариньяни. Этот подход, основанный на семантике, гораздо ближе к смыслу запроса. В нем
используется синтаксическая информация из предыдущего подхода, а также информация из
семантических словарей. Каждое слово в словаре имеет характеристики, позволяющие
определять смысловые отношения между ним и другими словами, точнее, их значениями.
Полное описание связей между смыслами слов (а одно слово часто имеет несколько
смыслов) образует тезаурус, представляющий собой большую сеть со словами и их
смыслами в качестве узлов. С помощью таких тезаурусов выполняется построение
семантического представления запроса. Основная задача при этомотсечь ненужные
смыслы, постараться выделить с помощью синтаксических связей достоверные
семантические конструкции. В больших предложениях, особенно с многозначными словами,
это часто приводит к комбинаторному взрывуперебору множества смыслов и связей
между ними, а также многозначности синтаксических конструкций (одному и тому же
предложению может быть сопоставлено несколько синтаксических представлений),
обработка которых занимает неприемлемо большое время. Это лишь одна проблема, стоящая
на пути понимания естественно-языковых запросов в традиционной синтаксически-
S
NP
VP
V
NT
N
T
N T
какие студенты учатся группе 630
отобразить дерево синтаксического разбора в следующий запрос к базе данных:
     SELECT (student) WHERE group="630".

                                              S

                                 NP                      VP

                                                              NT

                            N         T         V        N         T

                         какие студенты учатся группе              630
                                Рис. 7. Дерево синтаксического разбора

     Отображение дерева в выражение запроса производится с помощью правил, и целиком
основывается на синтаксической информации дерева разбора. Правила отображения могут
быть следующими:
        •   "какие" отображается в SELECT;
        •   "студент" отображается в student;
        •   "группа" отображается в group;
        •   поддерево NT отображается в N="T" (в нашем примере будет group="630");
        •   поддерево NP отображается в det(N) (SELECT (student));
        •   поддерево VP отображается в WHERE NT (WHERE group="630");
        • S отображается в NP and VP (SELECT (student) WHERE group="630").
     Обычно трудно составить систему правил, трансформирующих дерево разбора
напрямую в некоторое выражение на языке запросов к реальным базам данных (например,
SQL), поэтому данный подход применятся в основном в комбинации с другими.
     Семантически-ориентированный метод анализа ЕЯ-запросов был предложен А.С.
Нариньяни. Этот подход, основанный на семантике, гораздо ближе к смыслу запроса. В нем
используется синтаксическая информация из предыдущего подхода, а также информация из
семантических словарей. Каждое слово в словаре имеет характеристики, позволяющие
определять смысловые отношения между ним и другими словами, точнее, их значениями.
Полное описание связей между смыслами слов (а одно слово часто имеет несколько
смыслов) образует тезаурус, представляющий собой большую сеть со словами и их
смыслами в качестве узлов. С помощью таких тезаурусов выполняется построение
семантического представления запроса. Основная задача при этом — отсечь ненужные
смыслы, постараться выделить с помощью синтаксических связей достоверные
семантические конструкции. В больших предложениях, особенно с многозначными словами,
это часто приводит к комбинаторному взрыву — перебору множества смыслов и связей
между ними, а также многозначности синтаксических конструкций (одному и тому же
предложению может быть сопоставлено несколько синтаксических представлений),
обработка которых занимает неприемлемо большое время. Это лишь одна проблема, стоящая
на пути понимания естественно-языковых запросов в традиционной синтаксически-


                                                    30