Естественно-языковые системы. Евдокимова И.С. - 72 стр.

UptoLike

Составители: 

72
с помощью которого может быть математически описан любой аспект морфологии русского
языка. В данной модели текст рассматривается как многоуровневая конструкция: из букв
слагаются морфы, из морфсловоформы, из словоформпредложения, из предложений
абзацы и т.д. Отдельные части этой конструкциибуквы, морфы, словоформы, предложения
и т.д. называют фрагментами текста, а фрагментное отношение L(X, Y), у которого в роли
переменной Y выступает часть слова (например, буква, морфема) или целое слово,
называется морфологическим отношением. Описание морфологических отношений
производится на языке алгебры конечных предикатов. В силу принципа однозначности
любое морфологическое отношение L(X, Y) есть функция зависимости фрагмента Y от его
смысла Х, поэтому иногда морфологическое отношение называют морфологической
функцией.
Морфологическая функция представляется в виде функции Y = F(X). В качестве
переменной Y используются такие понятия, как основа словоформы, окончание, суффикс и
т.д., а в качестве структуры переменной Х- часть речи, род, число, падеж и т.д.
Однако данная модель распространяется лишь на небольшую часть механизма
склонения имен существительных и прилагательных. Многие явления, непосредственно
относящиеся к процессу склонения, не описываются моделью, что может привести к
некорректному разбиению на фрагменты словоформы и, как следствие, неверному
морфологическому анализу.
Другим подходом при создании универсальных математических моделей МА является
построение адекватных формальных моделей с учетом всех фактов языка. Рассмотрим
модель морфологии системы «СмыслТекст», представляющую интерес с точки зрения
реализации данного подхода.
Эта модель в отличие от предыдущих ориентирована на синтез словоформ. В общем
виде правила морфологического синтеза выглядят следующим образом:
(λ, χ) v,
где λ - символ лексемы; χ - морфологические характеристики, v – словоформа.
В модели используются семь промежуточных уровней:
глубинно-морфологическое представление;
укрупненная морфологическая схема;
морфемная схема;
поверхностно-морфологическое представление;
цепочка не чередованных морфем;
цепочка чередованных морфем;
орфографическая словоформа.
Преобразованию при переходе с одного уровня на другой подвергается тройка (λ
i
, χ
i
,ε
i
), где λ
i
некоторая часть синтактики (точнее, морфологического описания) лексемы,
отображающая и заменяющая лексему на i-том уровне, χ
i
релевантная для i-го уровня часть
характеристик, ε
i
соответствующая i-му уровню формируемая цепочка символов.
На первом этапе происходит обращение к словарной статье лексемы и переработка в
с помощью которого может быть математически описан любой аспект морфологии русского
языка. В данной модели текст рассматривается как многоуровневая конструкция: из букв
слагаются морфы, из морф – словоформы, из словоформ – предложения, из предложений –
абзацы и т.д. Отдельные части этой конструкции – буквы, морфы, словоформы, предложения
и т.д. называют фрагментами текста, а фрагментное отношение L(X, Y), у которого в роли
переменной Y выступает часть слова (например, буква, морфема) или целое слово,
называется морфологическим отношением. Описание морфологических отношений
производится на языке алгебры конечных предикатов. В силу принципа однозначности
любое морфологическое отношение L(X, Y) есть функция зависимости фрагмента Y от его
смысла Х, поэтому иногда морфологическое отношение называют морфологической
функцией.
       Морфологическая функция представляется в виде функции Y = F(X). В качестве
переменной Y используются такие понятия, как основа словоформы, окончание, суффикс и
т.д., а в качестве структуры переменной Х- часть речи, род, число, падеж и т.д.
       Однако данная модель распространяется лишь на небольшую часть механизма
склонения имен существительных и прилагательных. Многие явления, непосредственно
относящиеся к процессу склонения, не описываются моделью, что может привести к
некорректному разбиению на фрагменты словоформы и, как следствие, неверному
морфологическому анализу.
       Другим подходом при создании универсальных математических моделей МА является
построение адекватных формальных моделей с учетом всех фактов языка. Рассмотрим
модель морфологии системы «Смысл – Текст», представляющую интерес с точки зрения
реализации данного подхода.
       Эта модель в отличие от предыдущих ориентирована на синтез словоформ. В общем
виде правила морфологического синтеза выглядят следующим образом:
                        (λ, χ) → v,
где λ - символ лексемы; χ - морфологические характеристики, v – словоформа.
     В модели используются семь промежуточных уровней:
        ƒ глубинно-морфологическое представление;
        ƒ укрупненная морфологическая схема;
        ƒ морфемная схема;
        ƒ поверхностно-морфологическое представление;
        ƒ цепочка не чередованных морфем;
        ƒ цепочка чередованных морфем;
        ƒ орфографическая словоформа.
     Преобразованию при переходе с одного уровня на другой подвергается тройка (λi, χi
,εi), где λi – некоторая часть синтактики (точнее, морфологического описания) лексемы,
отображающая и заменяющая лексему на i-том уровне, χi – релевантная для i-го уровня часть
характеристик, εi – соответствующая i-му уровню формируемая цепочка символов.
     На первом этапе происходит обращение к словарной статье лексемы и переработка в


                                              72