ВУЗ:
Составители:
Рубрика:
65
РАЗДЕЛ 3. МОРФОЛОГИЧЕСКИЙ АНАЛИЗ ЕЯ-ТЕКСТОВ
Лекция 6. Анализ методов и подходов морфологического анализа
Стадия морфологического анализа (МА) является наиболее проработанным
лингвистическим этапом процесса обработки естественного текста. За последние два
десятилетия создано, по крайней мере, несколько десятков алгоритмов для разных языков, в
том числе 10-12 для русского (Г.Г. Белоногов, И.А. Мельчук и др.).
Цель морфологического анализа (МА) заключается в определении морфологической
информации словоформ для использования ее на последующих этапах обработки ЕЯ текста.
На рисунке 13 изображена классификация морфологических признаков слов русского языка.
Рис.13. Морфологические признаки слов русского языка
Существуют три основных метода реализации МА: декларативный, процедурный и
комбинированный.
При декларативном методе в словаре хранятся все возможные словоформы каждого
слова с приписанной им морфологической информацией (МИ). В этом случае задача МА
состоит просто в поиске словоформы в словаре и переписывании из словаря МИ [12, 14],
поэтому можно считать, что в этом методе отсутствует как таковой морфологический анализ,
а хранится только его результат. Так как количество различных словоформ у каждого слова
довольно велико, декларативный метод требует больших затрат памяти ВС, что порождает
ряд технических проблем, заключающихся в больших затратах труда на создание и
поддержание словаря, в высокой избыточности информации. Достоинствами метода
Морфологические
признаки
Часть речи
существительное
прилагательное
глагол
наречие
числительное
предлог
композит
союз
частица
Род
мужской
женский
средний
Время
настоящее-будущее
прошедшее
настоящее (гл. быть)
Лицо
первое
второе
третье
Од
у
шевленность
одушевленное
неодушевленное
Число
единст.
множ.
Падеж
именительный
родительный
дательный
винительный
творительный
предложный
Степень
сравнения
сравнительная
превосходная
К
р
аткость
краткое
Вид
несовершенный
совершенный
РАЗДЕЛ 3. МОРФОЛОГИЧЕСКИЙ АНАЛИЗ ЕЯ-ТЕКСТОВ Лекция 6. Анализ методов и подходов морфологического анализа Стадия морфологического анализа (МА) является наиболее проработанным лингвистическим этапом процесса обработки естественного текста. За последние два десятилетия создано, по крайней мере, несколько десятков алгоритмов для разных языков, в том числе 10-12 для русского (Г.Г. Белоногов, И.А. Мельчук и др.). Цель морфологического анализа (МА) заключается в определении морфологической информации словоформ для использования ее на последующих этапах обработки ЕЯ текста. На рисунке 13 изображена классификация морфологических признаков слов русского языка. Морфологические признаки Часть речи Род Число Лицо Падеж единст. существительное мужской первое множ. прилагательное женский второе именительный глагол средний третье родительный наречие дательный числительное винительный предлог творительный композит Краткость предложный союз краткое частица Время Вид Степень Одушевленность сравнения несовершенный одушевленное настоящее-будущее совершенный сравнительная неодушевленное прошедшее настоящее (гл. быть) превосходная Рис.13. Морфологические признаки слов русского языка Существуют три основных метода реализации МА: декларативный, процедурный и комбинированный. При декларативном методе в словаре хранятся все возможные словоформы каждого слова с приписанной им морфологической информацией (МИ). В этом случае задача МА состоит просто в поиске словоформы в словаре и переписывании из словаря МИ [12, 14], поэтому можно считать, что в этом методе отсутствует как таковой морфологический анализ, а хранится только его результат. Так как количество различных словоформ у каждого слова довольно велико, декларативный метод требует больших затрат памяти ВС, что порождает ряд технических проблем, заключающихся в больших затратах труда на создание и поддержание словаря, в высокой избыточности информации. Достоинствами метода 65
Страницы
- « первая
- ‹ предыдущая
- …
- 63
- 64
- 65
- 66
- 67
- …
- следующая ›
- последняя »