Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 16 стр.

UptoLike

16
(например, в лице и числе между подлежащим и сказуемым). КС-аппарат неудобен также
для отображения разорванных зависимостей (long-distance dependencies), вызванных
передвижением слов по фразе, или для описания отсутствия составляющих (deletion).
S = NPVP ADJECTIVE = молодой
VP = VERB ADJECTIVE = старого
VP = VERBNP ADJECTIVE = лежащего
NP = NOUN NOUN = лис
NP = ADJECTIVENP NOUN = волка
PP = PREPOSITION NP VERB = видит
VERB = лежит
Рис. 1.5. Пример КС-правил (S - предложение, NP - именная группа, VP - глагольная
группа, РР - предложная группа)
В традиции трансформационных грамматик для представления подобных феноменов
вводятся трансформации, переводящие синтаксическую структуру таких фраз в
стандартную. Одним из способов отражения изменений синтаксической структуры без
использования трансформаций является Node raising. В такой методологии то место,
которое должно быть занято некоторой именной группой в стандартной синтаксической
структуре дерева составляющих, обозначается пустым узлом и дополняется признаком
slash (NP/). Такой узел располагается, как правило, справа от реальной позиции
соответствующей составляющей и в более глубокой, составляющей дерева (например, Wh-
группа зависит от корня дерева, a NP/ - от глагольной группы). В таком описании Wh-
группа как бы поднимается относительно своей стандартной позиции (отсюда понятие
raising).
В классических КС-грамматиках так же неестественно представляется такой
феномен, как субкатегоризация, т.е. специфические свойства подкласса какой-либо
категории. Например, КС-грамматика, изображенная на рисунке 1.5, не отличает
переходные и непереходные глаголы, поэтому она принимает предложения, содержащие
прямые дополнения у непереходных глаголов. Если же ввести два нетерминальных
символа, TV и IV для переходных и непереходных глаголов соответственно, то в этом
формализме невозможно будет отразить свойства, общие для обеих групп глаголов. Все эти
проблемы приводят к тому, что грамматические формализмы расширяют аппарат КС-
правил с целью представления подобных феноменов.
Кроме отмеченных выше проблем КС-грамматики добавляют еще одну. В правиле,
выражающем отношения между составляющими, не отражается естественная особенность
естественных языков - поглощение одной категории другой, так что новая составляющая
выступает заменителем управляющей категории. В частности, есть очевидное сходство в
образовании именных групп из существительных и глагольных групп из глаголов. По этой
причине синтаксис КС-правила, использующего составляющие, ограничивается описанием
отношения категории X и категории, которой она управляет. Например, если
существительное управляет определением, тогда именная группа может быть записана как
N (иногда записывается как N’).
С другой стороны, построение именной группы завершается указанием
спецификатора (артикля или местоимения), для отражения такого факта вводится
(например, в лице и числе между подлежащим и сказуемым). КС-аппарат неудобен также
для отображения разорванных зависимостей (long-distance dependencies), вызванных
передвижением слов по фразе, или для описания отсутствия составляющих (deletion).

S      = NPVP     ADJECTIVE       = молодой
VP     = VERB     ADJECTIVE       = старого
VP     = VERBNP ADJECTIVE         = лежащего
NP     = NOUN       NOUN          = лис
NP     = ADJECTIVENP NOUN         = волка
PP     = PREPOSITION NP VERB      = видит
                        VERB      = лежит

     Рис. 1.5. Пример КС-правил (S - предложение, NP - именная группа, VP - глагольная
                            группа, РР - предложная группа)

      В традиции трансформационных грамматик для представления подобных феноменов
вводятся трансформации, переводящие синтаксическую структуру таких фраз в
стандартную. Одним из способов отражения изменений синтаксической структуры без
использования трансформаций является Node raising. В такой методологии то место,
которое должно быть занято некоторой именной группой в стандартной синтаксической
структуре дерева составляющих, обозначается пустым узлом и дополняется признаком
slash (NP/). Такой узел располагается, как правило, справа от реальной позиции
соответствующей составляющей и в более глубокой, составляющей дерева (например, Wh-
группа зависит от корня дерева, a NP/ - от глагольной группы). В таком описании Wh-
группа как бы поднимается относительно своей стандартной позиции (отсюда понятие
raising).
      В классических КС-грамматиках так же неестественно представляется такой
феномен, как субкатегоризация, т.е. специфические свойства подкласса какой-либо
категории. Например, КС-грамматика, изображенная на рисунке 1.5, не отличает
переходные и непереходные глаголы, поэтому она принимает предложения, содержащие
прямые дополнения у непереходных глаголов. Если же ввести два нетерминальных
символа, TV и IV для переходных и непереходных глаголов соответственно, то в этом
формализме невозможно будет отразить свойства, общие для обеих групп глаголов. Все эти
проблемы приводят к тому, что грамматические формализмы расширяют аппарат КС-
правил с целью представления подобных феноменов.
      Кроме отмеченных выше проблем КС-грамматики добавляют еще одну. В правиле,
выражающем отношения между составляющими, не отражается естественная особенность
естественных языков - поглощение одной категории другой, так что новая составляющая
выступает заменителем управляющей категории. В частности, есть очевидное сходство в
образовании именных групп из существительных и глагольных групп из глаголов. По этой
причине синтаксис КС-правила, использующего составляющие, ограничивается описанием
отношения категории X и категории, которой она управляет. Например, если
существительное управляет определением, тогда именная группа может быть записана как
N (иногда записывается как N’).
     С другой стороны, построение именной группы завершается указанием
спецификатора (артикля или местоимения), для отражения такого факта вводится
                                           16