Естественно-языковые системы. Евдокимова И.С. - 73 стр.

UptoLike

Составители: 

73
ней информации. При этом правила выбора основной морфы присоединяются ко всем
остальным правилам преобразования элементов цепочек ε
i
, а из морф, характеристики χ и
синтактики ξ компонуется новый вектор f, называемый грамматической характеристикой. На
этом же этапе подготавливаются векторы Ф
i
, состоящие из значений признаков вектора f,
релевантных для этого этапа преобразования цепочки ε
i
. По сути дела, Ф
i
объединяет в себе
λ
i
и χ
i
(как правило, в разные Ф
i
входят значения разных признаков вектора f).
Однотипный алгоритм синтеза переводит двойку (Ф
i
, ε
i
) (i = 0, 1, …) в ε
i+1
, затем к
последней присоединяется заранее сформированный вектор Ф
i+1
, после чего цикл
формирования цепочки следующего уровня повторяется вплоть до формирования
словоформы.
Морфологические правила при этом делятся на три группы:
1 – описание недопустимых вариантов характеристик;
2 – осуществляют компоновку признаков морфологической характеристики и
синтактики в грамматическую характеристику f;
3 – основная часть правил, осуществляющих преобразование элементов цепочек ε
i
.
В рассмотренной модели предлагается единая форма таких правил:
Q |- Aσ
i
B Aξ
i+1
B,
где |- - разделительный знак;
Q – условие применимости правила в виде ДНФ, элементами конъюнкций в которой
служат утверждения относительно значений признаков упомянутой грамматической
характеристики;
σ
i
заменяющий символ;
ξ
i+1
возникающая подцепочка символов, иногда пустая;
А, Врелевантный внутрицепочечный контекст, т.е. другие подцепочки, которые в
частном случае могут содержать и символы, возникающие на рассмотренном этапе синтеза.
Морфологическое описание лексемы состоит из правил выбора основной морфы и
лексемной синтактики ξ, сжато характеризующей правила выбора аффиксальных морф для
всех включенных в парадигму данной лексемы словоформ. Правила выбора основы имеют
общий вид:
Q |- {основа} α,
где Q – условие в виде ДНФ из значений признаков грамматической характеристики f
1
;
{основа} – символ основной морфемы;
α - цепочка символов более низкого уровня, чем {основа}.
Обычно правило выбора основы является безусловным. При построении данной
модели учитывались все возможные факты русской морфологии. Поэтому здесь можно
описать любую русскую лексему, а с помощью соответствующего множества правил
подстановоксинтезировать любую словоформу этой лексемы.
В данном разделе описаны методы и подходы к проведению морфологического анализа
словоформ. Указаны недостатки и достоинства каждого из методов. Рассмотрены модели
ней информации. При этом правила выбора основной морфы присоединяются ко всем
остальным правилам преобразования элементов цепочек εi, а из морф, характеристики χ и
синтактики ξ компонуется новый вектор f, называемый грамматической характеристикой. На
этом же этапе подготавливаются векторы Фi, состоящие из значений признаков вектора f,
релевантных для этого этапа преобразования цепочки εi. По сути дела, Фi объединяет в себе
λi и χi (как правило, в разные Фi входят значения разных признаков вектора f).
     Однотипный алгоритм синтеза переводит двойку (Фi, εi) (i = 0, 1, …) в εi+1, затем к
последней присоединяется заранее сформированный вектор Фi+1, после чего цикл
формирования цепочки следующего уровня повторяется вплоть до формирования
словоформы.
     Морфологические правила при этом делятся на три группы:
     1 – описание недопустимых вариантов характеристик;
     2 – осуществляют компоновку признаков морфологической характеристики и
синтактики в грамматическую характеристику f;
     3 – основная часть правил, осуществляющих преобразование элементов цепочек εi.
     В рассмотренной модели предлагается единая форма таких правил:
                                      Q |- Aσi B → Aξi+1 B,
где |- - разделительный знак;
     Q – условие применимости правила в виде ДНФ, элементами конъюнкций в которой
служат утверждения относительно значений признаков упомянутой грамматической
характеристики;
     σi – заменяющий символ;
     ξi+1 – возникающая подцепочка символов, иногда пустая;
     А, В – релевантный внутрицепочечный контекст, т.е. другие подцепочки, которые в
частном случае могут содержать и символы, возникающие на рассмотренном этапе синтеза.
     Морфологическое описание лексемы состоит из правил выбора основной морфы и
лексемной синтактики ξ, сжато характеризующей правила выбора аффиксальных морф для
всех включенных в парадигму данной лексемы словоформ. Правила выбора основы имеют
общий вид:
                                     Q |- {основа} → α,
где Q – условие в виде ДНФ из значений признаков грамматической характеристики f1;
     {основа} – символ основной морфемы;
     α - цепочка символов более низкого уровня, чем {основа}.
     Обычно правило выбора основы является безусловным. При построении данной
модели учитывались все возможные факты русской морфологии. Поэтому здесь можно
описать любую русскую лексему, а с помощью соответствующего множества правил
подстановок – синтезировать любую словоформу этой лексемы.

     В данном разделе описаны методы и подходы к проведению морфологического анализа
словоформ. Указаны недостатки и достоинства каждого из методов. Рассмотрены модели


                                                 73