ВУЗ:
Составители:
Рубрика:
14
прочь» будет представлена так, как показано на рисунке 1.4.
Отличительной особенностью модели дерева составляющих является то, что она
задает порядок (степень близости между словами) во множестве слов, которые в
предыдущей модели подчинялись бы одному и тому же узлу.
Здесь Σ - символ предложения, А – прилагательное, N – существительное, V – глагол,
А
dv
– наречие, NР – именная группа, VР - глагольная группа.
Дерево составляющих передает также соответствие между синтагматикой и
линейной упорядоченностью слов в предложении. Нарушение прямого соответствия
выражается в форме прерывных (или разрывных) составляющих, которые особенно
распространены в языках со свободным порядком слов. Как и в графе зависимостей, в
дереве составляющих могут использоваться условные узлы и связи.
Следует подчеркнуть, что системы составляющих и деревья зависимостей
характеризуют синтаксическую структуру предложения в разных аспектах. С помощью
первых описываются в явном виде словосочетания, но игнорируется ориентация связей
(т.е. не различаются “хозяин” и “слуга”); вторые дают возможность рассматривать
направленные связи, но только между отдельными словами.
B настоящее время распространенным способом описания синтаксической структуры
является комбинирование приемов двух классических моделей: обозначение порядка
замыкания связей в дереве составляющих систем ЛГУ (2 версия), использование
нетерминальных узлов в графах зависимостей системы ПОЭТ [33].
Выбор того или иного способа представления синтаксической структуры в
значительной степени связан с устройством алгоритма синтаксического анализа. Для
жестко заданных процедур, вычисляющих синтаксическую структуру предложения по
«формуле» правильной структуры, в качестве такой формулы плохо подходит модель типа
граф зависимостей: она либо не доопределяет процедуру построения синтаксической
структуры и тогда появляется слишком много вариантов анализа, либо - если используются
сильные ограничения - как формула становится слишком сложной для вычисления.
Формальные грамматики работают, как правило, с синтаксическим представлением в виде
дерева составляющих. Привлекательными свойствами графа зависимостей является их
экономичность, удобство использования в преобразованиях, возможность представления
частичных результатов анализа в виде множества подграфов. Модель данного типа
используют системы групп Г.Г. Белоногова, APT, РЕЗОН, ЭТАП-2, ПОЭТ, АДАМАНТ,
САГА, большинство японских систем анализа текста и ряд других [25, 33].
С точки зрения описания естественного языка формальными теориями различают
A
dv
V
N
Σ
VP NP
A
убежал прочь
Рис. 1.4.
Бедный Джон
прочь» будет представлена так, как показано на рисунке 1.4. Отличительной особенностью модели дерева составляющих является то, что она задает порядок (степень близости между словами) во множестве слов, которые в предыдущей модели подчинялись бы одному и тому же узлу. Σ NP VP A N V Adv Бедный Джон убежал прочь Рис. 1.4. Здесь Σ - символ предложения, А – прилагательное, N – существительное, V – глагол, Аdv – наречие, NР – именная группа, VР - глагольная группа. Дерево составляющих передает также соответствие между синтагматикой и линейной упорядоченностью слов в предложении. Нарушение прямого соответствия выражается в форме прерывных (или разрывных) составляющих, которые особенно распространены в языках со свободным порядком слов. Как и в графе зависимостей, в дереве составляющих могут использоваться условные узлы и связи. Следует подчеркнуть, что системы составляющих и деревья зависимостей характеризуют синтаксическую структуру предложения в разных аспектах. С помощью первых описываются в явном виде словосочетания, но игнорируется ориентация связей (т.е. не различаются “хозяин” и “слуга”); вторые дают возможность рассматривать направленные связи, но только между отдельными словами. B настоящее время распространенным способом описания синтаксической структуры является комбинирование приемов двух классических моделей: обозначение порядка замыкания связей в дереве составляющих систем ЛГУ (2 версия), использование нетерминальных узлов в графах зависимостей системы ПОЭТ [33]. Выбор того или иного способа представления синтаксической структуры в значительной степени связан с устройством алгоритма синтаксического анализа. Для жестко заданных процедур, вычисляющих синтаксическую структуру предложения по «формуле» правильной структуры, в качестве такой формулы плохо подходит модель типа граф зависимостей: она либо не доопределяет процедуру построения синтаксической структуры и тогда появляется слишком много вариантов анализа, либо - если используются сильные ограничения - как формула становится слишком сложной для вычисления. Формальные грамматики работают, как правило, с синтаксическим представлением в виде дерева составляющих. Привлекательными свойствами графа зависимостей является их экономичность, удобство использования в преобразованиях, возможность представления частичных результатов анализа в виде множества подграфов. Модель данного типа используют системы групп Г.Г. Белоногова, APT, РЕЗОН, ЭТАП-2, ПОЭТ, АДАМАНТ, САГА, большинство японских систем анализа текста и ряд других [25, 33]. С точки зрения описания естественного языка формальными теориями различают 14
Страницы
- « первая
- ‹ предыдущая
- …
- 12
- 13
- 14
- 15
- 16
- …
- следующая ›
- последняя »