ВУЗ:
Составители:
Рубрика:
71
Анализ словоформ
В морфологическом анализе минимально формально выделяемой единицей связного
текста считается лексема (слово). В составе лексемы различают корневые морфемы,
префиксы, суффиксы и окончания. Известно, что корень несет основную смысловую
нагрузку. Однако замена этих префиксов на другие приводит к изменению смысла, а замена
аффиксов - к изменению синтаксической функции. Поэтому в методе осуществляется
отождествление не только корней, но и словообразующих морфем.
Морфологический анализ словоформ начинается с декларативного способа. При
успешном завершении поиска из словаря готовых словоформ извлекается код флективного
класса, соответствующий данной лексеме и указывающий на часть речи и синтаксическую
функцию словоформы. На этом морфологический анализ рассматриваемого слова
заканчивается, и осуществляется переход к обработке следующей лексемы. В случае
процедурного способа словоформа подвергается флективному анализу. Флективный анализ
включает в себя три этапа:
идентификация морфем словоформы (последовательная проверка возможностей
вложения в анализируемую словоформу корня, суффикса, окончания и
приставки);
определение флективного класса словоформы (извлечение кода ФК из таблиц
совместимости корня со словообразующими аффиксами);
присвоение словоформе морфологической информации.
Все эти этапы тесно взаимосвязаны между собой, так как неудачное завершение
второго и третьего этапов свидетельствуют о некорректном разбиении анализируемой
словоформы на морфемы. На первом этапе идентифицируются следующие морфемы слова:
корень; словообразующие аффиксы.
С целью выделения морфем выполняется последовательная проверка возможностей
вложения в анализируемую словоформу справа налево суффиксов и окончаний, и слева
направо префиксов.
Другое направление использует информацию, содержащуюся в конечных
буквосочетаниях (эта информация получается в результате предварительной статистической
обработки словаря). Этот путь также дает достаточно хорошие результаты для практических
целей.
Третье направление развивается в последние годы. Оно вызвано стремлением
преодолеть ограниченность существующих алгоритмов морфологического анализа.
Известно, что они ориентировались на тексты определенной тематики и поэтому не
полностью учитывали все особенности морфологии. Это направление пытается построить
более адекватные морфологические модели. Создаются универсальные математические
модели в форме открытой системы уравнений, позволяющих путем вычисления
осуществлять нормализацию словоформ, получение грамматической информации и синтез
словоформ. Одной из таких моделей является модель Ю. П. Шабанова-Кушнаренко [15],
моделирующая процессы русского языка посредством языка алгебры конечных предикатов,
Анализ словоформ В морфологическом анализе минимально формально выделяемой единицей связного текста считается лексема (слово). В составе лексемы различают корневые морфемы, префиксы, суффиксы и окончания. Известно, что корень несет основную смысловую нагрузку. Однако замена этих префиксов на другие приводит к изменению смысла, а замена аффиксов - к изменению синтаксической функции. Поэтому в методе осуществляется отождествление не только корней, но и словообразующих морфем. Морфологический анализ словоформ начинается с декларативного способа. При успешном завершении поиска из словаря готовых словоформ извлекается код флективного класса, соответствующий данной лексеме и указывающий на часть речи и синтаксическую функцию словоформы. На этом морфологический анализ рассматриваемого слова заканчивается, и осуществляется переход к обработке следующей лексемы. В случае процедурного способа словоформа подвергается флективному анализу. Флективный анализ включает в себя три этапа: идентификация морфем словоформы (последовательная проверка возможностей вложения в анализируемую словоформу корня, суффикса, окончания и приставки); определение флективного класса словоформы (извлечение кода ФК из таблиц совместимости корня со словообразующими аффиксами); присвоение словоформе морфологической информации. Все эти этапы тесно взаимосвязаны между собой, так как неудачное завершение второго и третьего этапов свидетельствуют о некорректном разбиении анализируемой словоформы на морфемы. На первом этапе идентифицируются следующие морфемы слова: корень; словообразующие аффиксы. С целью выделения морфем выполняется последовательная проверка возможностей вложения в анализируемую словоформу справа налево суффиксов и окончаний, и слева направо префиксов. Другое направление использует информацию, содержащуюся в конечных буквосочетаниях (эта информация получается в результате предварительной статистической обработки словаря). Этот путь также дает достаточно хорошие результаты для практических целей. Третье направление развивается в последние годы. Оно вызвано стремлением преодолеть ограниченность существующих алгоритмов морфологического анализа. Известно, что они ориентировались на тексты определенной тематики и поэтому не полностью учитывали все особенности морфологии. Это направление пытается построить более адекватные морфологические модели. Создаются универсальные математические модели в форме открытой системы уравнений, позволяющих путем вычисления осуществлять нормализацию словоформ, получение грамматической информации и синтез словоформ. Одной из таких моделей является модель Ю. П. Шабанова-Кушнаренко [15], моделирующая процессы русского языка посредством языка алгебры конечных предикатов, 71
Страницы
- « первая
- ‹ предыдущая
- …
- 69
- 70
- 71
- 72
- 73
- …
- следующая ›
- последняя »