Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 140 стр.

UptoLike

Приложение Е. Описание программного обеспечения и
вычислительных экспериментов
Описание набора программ
Для выполнения экспериментальной части работы разработан набор программ,
предназначенный для трансляции запросов пользователя, представленных в виде простых
предложений русского языка, в запросы SQL-ориентированных баз данных.
Разработанный набор программ разбит на два основных блока. Первый блок включает в
себя морфологический, синтаксический и проблемный анализаторы, второймодуль
управления продукционными правилами, систему преобразования условия применимости q
i
продукции pr
i
в стандартную скулемовскую форму для формирования множества дизъюнктов,
необходимых для доказательства истинности условия применимости, а также систему
логического вывода.
Описание первого блока программ
Программа морфологического анализатора предназначена для получения
морфологической информации простых слов русского языка, а также для склонения и
спряжения изменяемых слов, которые не были распознаны на этапе морфологического
анализа. Программа включает в себя базу знаний, представленную в виде множества
словарей, а также базу правил системы продукций морфологического анализа Pr
M
. Программа
состоит из четырех модулей:
- модуль MainUnit - интерфейс, который содержит ассоциированные процедуры
выделения лексем, запуск процедур из модуля Morph, вызов методов модуля добавления слов
в словарь (dicts), вызов модуля управления продукционными правилами второго компонента;
- модуль Morph содержит ассоциированные процедуры для поиска слова в словаре,
вычислительные процедуры морфологического анализа и процедуры удаления и добавления,
соответствующие программам r
i
M
Pr
M
;
- модуль Find содержит описания основных ассоциированных процедур для
осуществления работы со словарями и с базой правил системы продукций, процедуры вывода
результатов анализа;
- модуль dicts содержит описания переменных и ассоциированных процедур для
работы по добавлению слов в словари, анализирует и склоняет новые слова. Формирует
возможные группы склонения, к которым может принадлежать слово, а также содержит
методы, описывающие правила склонения слов различных частей речи.
Программа синтаксического анализа также имеет модульный характер. Программа
включает в себя базу знаний, представленную в виде словарей, а также базу правил системы
продукций синтаксического анализа PrS. Для обеспечения ее работы задействовано
множество стандартных модулей BDelphi, обеспечивающих работу визуальных компонент, и
шесть модулей, каждый из которых выполняет определенную подзадачу, а все вместе
обеспечивают выполнение синтаксического анализа:
- DataTool осуществляет построение дерева синтаксического разбора и содержит
функции и процедуры создания, управления и удаления деревьев;
- DataUnit предназначен для хранения используемых в программе невизуальных
компонент, которые являются доступными для любого другого модуля;
139
       Приложение Е. Описание программного обеспечения и
                вычислительных экспериментов
      Описание набора программ

     Для выполнения экспериментальной части работы разработан набор программ,
предназначенный для трансляции запросов пользователя, представленных в виде простых
предложений русского языка, в запросы SQL-ориентированных баз данных.
     Разработанный набор программ разбит на два основных блока. Первый блок включает в
себя морфологический, синтаксический и проблемный анализаторы, второй – модуль
управления продукционными правилами, систему преобразования условия применимости qi
продукции pri в стандартную скулемовскую форму для формирования множества дизъюнктов,
необходимых для доказательства истинности условия применимости, а также систему
логического вывода.

      Описание первого блока программ

     Программа        морфологического    анализатора  предназначена    для    получения
морфологической информации простых слов русского языка, а также для склонения и
спряжения изменяемых слов, которые не были распознаны на этапе морфологического
анализа. Программа включает в себя базу знаний, представленную в виде множества
словарей, а также базу правил системы продукций морфологического анализа PrM. Программа
состоит из четырех модулей:
     - модуль MainUnit - интерфейс, который содержит ассоциированные процедуры
выделения лексем, запуск процедур из модуля Morph, вызов методов модуля добавления слов
в словарь (dicts), вызов модуля управления продукционными правилами второго компонента;
     - модуль Morph содержит ассоциированные процедуры для поиска слова в словаре,
вычислительные процедуры морфологического анализа и процедуры удаления и добавления,
соответствующие программам riM∈PrM ;
     - модуль Find         содержит описания основных ассоциированных процедур для
осуществления работы со словарями и с базой правил системы продукций, процедуры вывода
результатов анализа;
       - модуль dicts содержит описания переменных и ассоциированных процедур для
работы по добавлению слов в словари, анализирует и склоняет новые слова. Формирует
возможные группы склонения, к которым может принадлежать слово, а также содержит
методы, описывающие правила склонения слов различных частей речи.
     Программа синтаксического анализа также имеет модульный характер. Программа
включает в себя базу знаний, представленную в виде словарей, а также базу правил системы
продукций синтаксического анализа PrS. Для обеспечения ее работы задействовано
множество стандартных модулей BDelphi, обеспечивающих работу визуальных компонент, и
шесть модулей, каждый из которых выполняет определенную подзадачу, а все вместе
обеспечивают выполнение синтаксического анализа:
     - DataTool осуществляет построение дерева синтаксического разбора и содержит
функции и процедуры создания, управления и удаления деревьев;
     - DataUnit предназначен для хранения используемых в программе невизуальных
компонент, которые являются доступными для любого другого модуля;
                                              139