Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 31 стр.

UptoLike

31
2.3.1.1. Словари и таблицы совместимости
Лингвистическое обеспечение, необходимое для выполнения морфологического
анализа, описано в Приложении А. В разработанном алгоритме морфологического анализа
используются словари окончаний, словарь флективных классов, словарь готовых
словоформ и словарь основ.
Произвольная форма слова может сильно отличаться от своей исходной формы (ШЕЛ
- ИДТИ), поэтому основная проблема при решении этой задачи - поиск исходной формы в
словаре. Эта проблема решается с помощью рабочих словарей, в число которых входят
словари основ, словари окончаний и словари флективных классов.
Словари окончаний включают окончания существительных, прилагательных, кратких
прилагательных, глаголов, глаголов в прошедшем времени и имеют структуру: [номер
окончания] [окончание]. Под окончанием понимается изменяющаяся часть слова, которые
определяют переменные морфологические параметры слова (например, для
существительногочисло и падеж). Словарь окончаний существительных имеет
структуру, показанную в таблице 2.
Таблица 2 - Словарь окончаний существительных
Окончание Окончание Окончание Окончание
1 о 11 ей 21 ев 31 ого
2 а 12 ов 22 й 32 ому
3 у 13 ы 23 ью 33 ый
4 ом 14 ой 24 ий 34 ым
5 е 15 ем 25 его 35 ые
6 _ 16 я 26 ему 36 ых
7 ам 17 ю 27 им 37 ыми
8 ами 18 ям 28 ие 38 ое
9 ах 19 ями 29 их 39 ее
10 и 20 ях 30 ими 40 ая
41 ую
Структура словарей окончаний прилагательных, кратких прилагательных, глаголов и
глаголов в прошедшем времени аналогична структуре словаря окончаний
существительных.
Словарь основ имеет структуру вида: [номер основы] [основа] (табл. 3).
Таблица 3 - Словарь основ
Номер основы Основа
1 абсолютн
2 абстрактн
3 автономн
… …
Часть речи представляет собой классы слов языка, выделяемые на основании
сходства их синтаксических, морфологических и логико-семантических свойств. Каждой
части речи свойствен свой набор грамматических категорий, причём этим набором
охватывается абсолютное большинство слов данной части речи. Многие слова,
относящиеся к одной и той же части речи, могут быть сгруппированы в отдельный
2.3.1.1. Словари и таблицы совместимости
     Лингвистическое обеспечение, необходимое для выполнения морфологического
анализа, описано в Приложении А. В разработанном алгоритме морфологического анализа
используются словари окончаний, словарь флективных классов, словарь готовых
словоформ и словарь основ.
     Произвольная форма слова может сильно отличаться от своей исходной формы (ШЕЛ
- ИДТИ), поэтому основная проблема при решении этой задачи - поиск исходной формы в
словаре. Эта проблема решается с помощью рабочих словарей, в число которых входят
словари основ, словари окончаний и словари флективных классов.
     Словари окончаний включают окончания существительных, прилагательных, кратких
прилагательных, глаголов, глаголов в прошедшем времени и имеют структуру: [номер
окончания] [окончание]. Под окончанием понимается изменяющаяся часть слова, которые
определяют переменные морфологические параметры слова (например, для
существительного – число и падеж). Словарь окончаний существительных имеет
структуру, показанную в таблице 2.
     Таблица 2 - Словарь окончаний существительных
   № Окончание         № Окончание         № Окончание          № Окончание
   1 о                 11 ей               21 ев                31 ого
   2 а                 12 ов               22 й                 32 ому
   3 у                 13 ы                23 ью                33 ый
   4 ом                14 ой               24 ий                34 ым
   5 е                 15 ем               25 его               35 ые
   6 _                 16 я                26 ему               36 ых
   7 ам                17 ю                27 им                37 ыми
   8 ами               18 ям               28 ие                38 ое
   9 ах                19 ями              29 их                39 ее
   10 и                20 ях               30 ими               40 ая
                                                                41 ую

     Структура словарей окончаний прилагательных, кратких прилагательных, глаголов и
глаголов в прошедшем времени аналогична структуре словаря окончаний
существительных.
     Словарь основ имеет структуру вида: [номер основы] [основа] (табл. 3).

     Таблица 3 - Словарь основ
            Номер основы Основа
            1                 абсолютн
            2                 абстрактн
            3                 автономн
            …                 …

     Часть речи представляет собой классы слов языка, выделяемые на основании
сходства их синтаксических, морфологических и логико-семантических свойств. Каждой
части речи свойствен свой набор грамматических категорий, причём этим набором
охватывается абсолютное большинство слов данной части речи. Многие слова,
относящиеся к одной и той же части речи, могут быть сгруппированы в отдельный

                                          31