Естественно-языковые системы. Евдокимова И.С. - 80 стр.

UptoLike

Составители: 

80
нетерминальными и терминальными символами.
S = NPVP ADJECTIVE = молодой
VP = VERB ADJECTIVE = старого
VP = VERBNP ADJECTIVE = лежащего
NP = NOUN NOUN = лис
NP = ADJECTIVENP NOUN = волка
PP = PREPOSITION NP VERB = видит
VERB = лежит
Рис. 18. Пример КС-правил (S - предложение, NP - именная группа, VP - глагольная группа, РР
- предложная группа)
Подобная грамматика описывает такие предложения, как "лис видит волка"; "молодой
лис видит старого волка"; "молодой лис видит старого лежачего волка"; "лис лежит" и т.д.
Достаточно просто расширить эту грамматику, чтобы представить в словаре русскую
морфологию в более полном виде. Заметим, что в данной грамматике выбор конкретного
правила для построения глагольных групп (VP-правила) или именных групп (NP-правила)
задан вариантами, гарантированный выбор между которыми сделать в рамках данного
правила невозможно. Подобная грамматика относится к так называемым
недетерминированным грамматикам.
Синтаксис КС-правил очень прост, однако для описания многих феноменов
естественного языка простого аппарата КС-грамматики оказывается недостаточно. В
частности, контекстно-свободными правилами неудобно описывать согласование (например,
в лице и числе между подлежащим и сказуемым). КС-аппарат неудобен также для
отображения разорванных зависимостей (long-distance dependencies), вызванных
передвижением слов по фразе, или для описания отсутствия составляющих (deletion).
В традиции трансформационных грамматик для представления подобных феноменов
вводятся трансформации, переводящие синтаксическую структуру таких фраз в
стандартную. Одним из способов отражения изменений синтаксической структуры без
использования трансформаций является Node raising. В такой методологии то место, которое
должно быть занято некоторой именной группой в стандартной синтаксической структуре
дерева составляющих, обозначается пустым узлом и дополняется признаком slash (NP/).
Такой узел располагается, как правило, справа от реальной позиции соответствующей
составляющей и в более глубокой, составляющей дерева (например, Wh-группа зависит от
корня дерева, a NP/ - от глагольной группы). В таком описании Wh-группа как бы
поднимается относительно своей стандартной позиции (отсюда понятие raising).
В классических КС-грамматиках так же неестественно представляется такой феномен,
как субкатегоризация, т.е. специфические свойства подкласса какой-либо категории.
Например, КС-грамматика, изображенная на рисунке 18, не отличает переходные и
непереходные глаголы, поэтому она принимает предложения, содержащие прямые
дополнения у непереходных глаголов. Если же ввести два нетерминальных символа, TV и IV
для переходных и непереходных глаголов соответственно, то в этом формализме
невозможно будет отразить свойства, общие для обеих групп глаголов. Все эти проблемы
нетерминальными и терминальными символами.
                            S      = NPVP      ADJECTIVE = молодой
                            VP     = VERB      ADJECTIVE = старого
                            VP     = VERBNP    ADJECTIVE = лежащего
                            NP     = NOUN        NOUN     = лис
                            NP     = ADJECTIVENP     NOUN = волка
                            PP     = PREPOSITION NP VERB = видит
                                                VERB      = лежит


     Рис. 18. Пример КС-правил (S - предложение, NP - именная группа, VP - глагольная группа, РР
                                     - предложная группа)

     Подобная грамматика описывает такие предложения, как "лис видит волка"; "молодой
лис видит старого волка"; "молодой лис видит старого лежачего волка"; "лис лежит" и т.д.
Достаточно просто расширить эту грамматику, чтобы представить в словаре русскую
морфологию в более полном виде. Заметим, что в данной грамматике выбор конкретного
правила для построения глагольных групп (VP-правила) или именных групп (NP-правила)
задан вариантами, гарантированный выбор между которыми сделать в рамках данного
правила    невозможно.    Подобная    грамматика     относится   к   так     называемым
недетерминированным грамматикам.
     Синтаксис КС-правил очень прост, однако для описания многих феноменов
естественного языка простого аппарата КС-грамматики оказывается недостаточно. В
частности, контекстно-свободными правилами неудобно описывать согласование (например,
в лице и числе между подлежащим и сказуемым). КС-аппарат неудобен также для
отображения разорванных зависимостей (long-distance dependencies), вызванных
передвижением слов по фразе, или для описания отсутствия составляющих (deletion).
     В традиции трансформационных грамматик для представления подобных феноменов
вводятся трансформации, переводящие синтаксическую структуру таких фраз в
стандартную. Одним из способов отражения изменений синтаксической структуры без
использования трансформаций является Node raising. В такой методологии то место, которое
должно быть занято некоторой именной группой в стандартной синтаксической структуре
дерева составляющих, обозначается пустым узлом и дополняется признаком slash (NP/).
Такой узел располагается, как правило, справа от реальной позиции соответствующей
составляющей и в более глубокой, составляющей дерева (например, Wh-группа зависит от
корня дерева, a NP/ - от глагольной группы). В таком описании Wh-группа как бы
поднимается относительно своей стандартной позиции (отсюда понятие raising).
     В классических КС-грамматиках так же неестественно представляется такой феномен,
как субкатегоризация, т.е. специфические свойства подкласса какой-либо категории.
Например, КС-грамматика, изображенная на рисунке 18, не отличает переходные и
непереходные глаголы, поэтому она принимает предложения, содержащие прямые
дополнения у непереходных глаголов. Если же ввести два нетерминальных символа, TV и IV
для переходных и непереходных глаголов соответственно, то в этом формализме
невозможно будет отразить свойства, общие для обеих групп глаголов. Все эти проблемы

                                                  80