Естественно-языковые системы. Евдокимова И.С. - 71 стр.

UptoLike

Составители: 

71
Анализ словоформ
В морфологическом анализе минимально формально выделяемой единицей связного
текста считается лексема (слово). В составе лексемы различают корневые морфемы,
префиксы, суффиксы и окончания. Известно, что корень несет основную смысловую
нагрузку. Однако замена этих префиксов на другие приводит к изменению смысла, а замена
аффиксов - к изменению синтаксической функции. Поэтому в методе осуществляется
отождествление не только корней, но и словообразующих морфем.
Морфологический анализ словоформ начинается с декларативного способа. При
успешном завершении поиска из словаря готовых словоформ извлекается код флективного
класса, соответствующий данной лексеме и указывающий на часть речи и синтаксическую
функцию словоформы. На этом морфологический анализ рассматриваемого слова
заканчивается, и осуществляется переход к обработке следующей лексемы. В случае
процедурного способа словоформа подвергается флективному анализу. Флективный анализ
включает в себя три этапа:
идентификация морфем словоформы (последовательная проверка возможностей
вложения в анализируемую словоформу корня, суффикса, окончания и
приставки);
определение флективного класса словоформы (извлечение кода ФК из таблиц
совместимости корня со словообразующими аффиксами);
присвоение словоформе морфологической информации.
Все эти этапы тесно взаимосвязаны между собой, так как неудачное завершение
второго и третьего этапов свидетельствуют о некорректном разбиении анализируемой
словоформы на морфемы. На первом этапе идентифицируются следующие морфемы слова:
корень; словообразующие аффиксы.
С целью выделения морфем выполняется последовательная проверка возможностей
вложения в анализируемую словоформу справа налево суффиксов и окончаний, и слева
направо префиксов.
Другое направление использует информацию, содержащуюся в конечных
буквосочетаниях (эта информация получается в результате предварительной статистической
обработки словаря). Этот путь также дает достаточно хорошие результаты для практических
целей.
Третье направление развивается в последние годы. Оно вызвано стремлением
преодолеть ограниченность существующих алгоритмов морфологического анализа.
Известно, что они ориентировались на тексты определенной тематики и поэтому не
полностью учитывали все особенности морфологии. Это направление пытается построить
более адекватные морфологические модели. Создаются универсальные математические
модели в форме открытой системы уравнений, позволяющих путем вычисления
осуществлять нормализацию словоформ, получение грамматической информации и синтез
словоформ. Одной из таких моделей является модель Ю. П. Шабанова-Кушнаренко [15],
моделирующая процессы русского языка посредством языка алгебры конечных предикатов,
Анализ словоформ
     В морфологическом анализе минимально формально выделяемой единицей связного
текста считается лексема (слово). В составе лексемы различают корневые морфемы,
префиксы, суффиксы и окончания. Известно, что корень несет основную смысловую
нагрузку. Однако замена этих префиксов на другие приводит к изменению смысла, а замена
аффиксов - к изменению синтаксической функции. Поэтому в методе осуществляется
отождествление не только корней, но и словообразующих морфем.
     Морфологический анализ словоформ начинается с декларативного способа. При
успешном завершении поиска из словаря готовых словоформ извлекается код флективного
класса, соответствующий данной лексеме и указывающий на часть речи и синтаксическую
функцию словоформы. На этом морфологический анализ рассматриваемого слова
заканчивается, и осуществляется переход к обработке следующей лексемы. В случае
процедурного способа словоформа подвергается флективному анализу. Флективный анализ
включает в себя три этапа:
         ƒ идентификация морфем словоформы (последовательная проверка возможностей
            вложения в анализируемую словоформу корня, суффикса, окончания и
            приставки);
         ƒ определение флективного класса словоформы (извлечение кода ФК из таблиц
            совместимости корня со словообразующими аффиксами);
         ƒ присвоение словоформе морфологической информации.
     Все эти этапы тесно взаимосвязаны между собой, так как неудачное завершение
второго и третьего этапов свидетельствуют о некорректном разбиении анализируемой
словоформы на морфемы. На первом этапе идентифицируются следующие морфемы слова:
корень; словообразующие аффиксы.
     С целью выделения морфем выполняется последовательная проверка возможностей
вложения в анализируемую словоформу справа налево суффиксов и окончаний, и слева
направо префиксов.
     Другое направление использует информацию, содержащуюся в конечных
буквосочетаниях (эта информация получается в результате предварительной статистической
обработки словаря). Этот путь также дает достаточно хорошие результаты для практических
целей.
     Третье направление развивается в последние годы. Оно вызвано стремлением
преодолеть ограниченность существующих алгоритмов морфологического анализа.
Известно, что они ориентировались на тексты определенной тематики и поэтому не
полностью учитывали все особенности морфологии. Это направление пытается построить
более адекватные морфологические модели. Создаются универсальные математические
модели в форме открытой системы уравнений, позволяющих путем вычисления
осуществлять нормализацию словоформ, получение грамматической информации и синтез
словоформ. Одной из таких моделей является модель Ю. П. Шабанова-Кушнаренко [15],
моделирующая процессы русского языка посредством языка алгебры конечных предикатов,


                                             71