Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 33 стр.

UptoLike

33
Продолжение таблицы 4
1403 а,у,ей,и,_,и ? задача 1411 а,у,ей,ы,_,ы ? улица
1404 а,у,ой,и,_,и ? заготовка 1412 и,и,ями,и,ей,и ? бигуди
неодушевленный, средний род
1500 о,о,ом,а,_,а ? место 1507 е,е,ем,я,ий,я ? побережье
1501 о,о,ом,а,ов,а ? облако 1508 о,о,ом,и,ей,и ? окно
1502 е,е,ем,я,ей,я ? поле 1509 о,о,ом,и,ов,и ? очко
1503 е,е,ем,я,й,я ? сомнение 1510 е,е,ем,я,ей,я ? ружье
1504 е,е,ем,а,_,а ? жилище 1511 о,о,ом,и,_,и ? колено
1505 о,о,ом,я,ев,я ? перо 1512 е,е,ем,я,ев,я ? платье
1506 я,я,ем,а,_,а ? время 1513 е,е,ем,а,ев,а ? блюдце
одушевленный, средний род
1514 и,ей,и,и,ей,ей ? дети 1603 ое,ое,ым,ые,ых,ых ? животное
другие ФК
1600
ый,ого,ым,ые,ых,ых
?
бездомный 1605 ая,ую,ой,ые,ых,ые ? ванная
1601 ий,его,им,ие,их,их ? нищий 1606 ая,ую,ой,ие,их,ие ? мастерская
1602
ой,ого,ым,ые,ых,ых
?
больной 1607 ий,ий,им,ие,их,ие ? английский
1604 ее,ее,им,ие,их,их ? болеутоляющее
Особым образом морфологическая подсистема обрабатывает слова-исключения, то
есть слова, у которых неизменной основы нет. Такие слова хранятся в отдельном словаре
готовых словоформ. Словарь имеет следующую структуру: [номер ФК], [словоформа]
(табл. 5), и включает в себя слова, относящиеся к служебным частям речи (наречия,
предлоги, союзы, неизменяемые существительные, неизменяемые прилагательные,
неизменяемые глаголы, инфинитив, сравнительную степень прилагательного, вводные
слова, междометия, деепричастия, цифры т.д.).
Таблица 5 - Словарь готовых словоформ
ФК Слово ФК Слово
7100 точь-в-точь 7203 эскимо
7100 по-татарски 7203 амплуа
7100 по-польски 7203 манто
…. ….
При морфологическом анализе необходимо отображать элементы одного множества в
элементы другого множества: Основа ФК; (ФК Окончание) МИ. Для
интерпретации отображений будем использовать таблицы совместимости, с помощью
которых устанавливается соответствие отображаемых элементов.
2.3.1.2. Алгоритм морфологического анализа
Входной информацией морфологического анализа является множество лексем
предложения запроса, словари основ, окончаний, готовых словоформ, флективных классов,
а также таблицы совместимости Основа ФК и (ФК Окончание) МИ. Ниже приведем
основные фазы морфологического анализа.
Шаг 1. Поиск лексемы в словаре готовых словоформ.
Шаг 2. Если словоформа найдена, то извлекаем код ФК и переходим на Шаг 6, в
                                                                 Продолжение таблицы 4
1403 а,у,ей,и,_,и ?       задача              1411 а,у,ей,ы,_,ы ?        улица
1404 а,у,ой,и,_,и ?       заготовка           1412 и,и,ями,и,ей,и ?      бигуди
неодушевленный, средний род
1500 о,о,ом,а,_,а ?       место               1507   е,е,ем,я,ий,я ?     побережье
1501 о,о,ом,а,ов,а ?      облако              1508   о,о,ом,и,ей,и ?     окно
1502 е,е,ем,я,ей,я ?      поле                1509   о,о,ом,и,ов,и ?     очко
1503 е,е,ем,я,й,я ?       сомнение            1510   е,е,ем,я,ей,я ?     ружье
1504 е,е,ем,а,_,а ?       жилище              1511   о,о,ом,и,_,и ?      колено
1505 о,о,ом,я,ев,я ?      перо                1512   е,е,ем,я,ев,я ?     платье
1506 я,я,ем,а,_,а ?       время               1513   е,е,ем,а,ев,а ?     блюдце
одушевленный, средний род
1514 и,ей,и,и,ей,ей ?     дети                1603 ое,ое,ым,ые,ых,ых ?   животное
другие ФК
      ый,ого,ым,ые,ых,ых
1600                      бездомный           1605 ая,ую,ой,ые,ых,ые ?   ванная
      ?
1601 ий,его,им,ие,их,их ? нищий               1606 ая,ую,ой,ие,их,ие ?   мастерская
      ой,ого,ым,ые,ых,ых
1602                      больной             1607 ий,ий,им,ие,их,ие ?   английский
      ?
1604 ее,ее,им,ие,их,их ?  болеутоляющее

      Особым образом морфологическая подсистема обрабатывает слова-исключения, то
есть слова, у которых неизменной основы нет. Такие слова хранятся в отдельном словаре
готовых словоформ. Словарь имеет следующую структуру: [номер ФК], [словоформа]
(табл. 5), и включает в себя слова, относящиеся к служебным частям речи (наречия,
предлоги, союзы, неизменяемые существительные, неизменяемые прилагательные,
неизменяемые глаголы, инфинитив, сравнительную степень прилагательного, вводные
слова, междометия, деепричастия, цифры т.д.).

     Таблица 5 - Словарь готовых словоформ
      ФК     Слово          ФК      Слово
      7100 точь-в-точь      7203 эскимо
      7100 по-татарски 7203 амплуа
      7100 по-польски       7203 манто
      ….     ….             …       …

     При морфологическом анализе необходимо отображать элементы одного множества в
элементы другого множества: Основа → ФК; (ФК ∧ Окончание) → МИ. Для
интерпретации отображений будем использовать таблицы совместимости, с помощью
которых устанавливается соответствие отображаемых элементов.

2.3.1.2. Алгоритм морфологического анализа
     Входной информацией морфологического анализа является множество лексем
предложения запроса, словари основ, окончаний, готовых словоформ, флективных классов,
а также таблицы совместимости Основа → ФК и (ФК ∧ Окончание) → МИ. Ниже приведем
основные фазы морфологического анализа.
     Шаг 1. Поиск лексемы в словаре готовых словоформ.
     Шаг 2. Если словоформа найдена, то извлекаем код ФК и переходим на Шаг 6, в

                                         33