Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 7 стр.

UptoLike

7
который после ряда последовательных преобразований содержит информацию,
необходимую для построения SQL-запроса.
База знаний, необходимая для выполнения анализа запроса, содержит метаописание
базы данных и знания проблемной среды. Модуль метаописания БД состоит из описания
концептуальной схемы базы данных на естественном языке: сущностей, атрибутов и связей
между сущностями. Модуль словарей содержит знания для проведения морфологического,
синтаксического анализов и трансляции естественно-языковых запросов к базе данных.
Модуль знаний проблемной среды содержит описания понятий и терминов предметной
области. Создаваемую естественно-языковую систему обработки запросов к базе данных
предполагается использовать при разработке больших информационных систем. База
знаний должна заполняться в процессе разработки проекта информационной системы.
Поскольку у многих информационных систем основным ядром является SQL-
ориентированные распределенные базы данных, то задача построения естественно-
языкового пользовательского интерфейса тесно связана с разработкой методов и
алгоритмов трансляции естественно-языковых запросов в запросы SQL языка. Таким
образом, предмет рассмотрения этой работыметоды, позволяющие осуществлять
преобразование запросов на естественном языке, представленных в виде простых
предложений русского языка, в SQL-запросы.
Работа состоит из введения, трех глав, заключения, литературы и 6 приложений.
В первой главе дан обзор существующих моделей лингвистического анализатора,
рассмотрена структура лингвистического анализатора, проанализированы методы и
алгоритмы морфологического, синтаксического и проблемного анализов, сделаны
основные выводы и сформулирована постановка задачи.
Во второй главе рассматривается математическая модель лингвистического трансля-
тора, которая включает в себя лингвистическую модель, базовые механизмы обработки
предложений и ассоциированные процедуры. Предложен аппарат для построения формаль-
ного описания лингвистических моделей, который основан на описании модели знаний
предметной области в виде множества подразумеваемых ситуаций. Поэтому решение задач
представляется в виде преобразований в пространстве ситуаций. Формальное отображение
ситуации описывается продукционными правилами, что позволяет представлять модели в
виде системы продукций, а решение задач строить как доказательство теорем, используя
метод линейной резолюции. На основе предложенного подхода построены модели
морфологического и синтаксического анализов транслятора в виде систем продукций.
Третья глава посвящена методам трансляции. В ней предложены формальные модели
метаописания базы данных и проблемной среды, которые описываются семейством
множеств закономерностей проблемной среды и концептуальной схемы базы данных,
представленных в виде формул предикатов второго порядка, описаны методы построения
графа, гомеоморфного графу зависимостей естественно-языкового запроса и методы
трансляции естественно-языковых запросов в SQL-запросы к базе данных.
В заключении приведены основные результаты работы и перспективы развития. В
приложениях приведены структура лингвистических словарей морфологического анализа,
системы продукций синтаксического анализа и система продукций по формированию SQL-
запроса, формальные модели метаописания базы данных и проблемной среды, описание
программного обеспечения и вычислительных экспериментов.
который после ряда последовательных преобразований содержит информацию,
необходимую для построения SQL-запроса.
      База знаний, необходимая для выполнения анализа запроса, содержит метаописание
базы данных и знания проблемной среды. Модуль метаописания БД состоит из описания
концептуальной схемы базы данных на естественном языке: сущностей, атрибутов и связей
между сущностями. Модуль словарей содержит знания для проведения морфологического,
синтаксического анализов и трансляции естественно-языковых запросов к базе данных.
Модуль знаний проблемной среды содержит описания понятий и терминов предметной
области. Создаваемую естественно-языковую систему обработки запросов к базе данных
предполагается использовать при разработке больших информационных систем. База
знаний должна заполняться в процессе разработки проекта информационной системы.
Поскольку у многих информационных систем основным ядром является SQL-
ориентированные распределенные базы данных, то задача построения естественно-
языкового пользовательского интерфейса тесно связана с разработкой методов и
алгоритмов трансляции естественно-языковых запросов в запросы SQL языка. Таким
образом, предмет рассмотрения этой работы – методы, позволяющие осуществлять
преобразование запросов на естественном языке, представленных в виде простых
предложений русского языка, в SQL-запросы.
      Работа состоит из введения, трех глав, заключения, литературы и 6 приложений.
      В первой главе дан обзор существующих моделей лингвистического анализатора,
рассмотрена структура лингвистического анализатора, проанализированы методы и
алгоритмы морфологического, синтаксического и проблемного анализов, сделаны
основные выводы и сформулирована постановка задачи.
      Во второй главе рассматривается математическая модель лингвистического трансля-
тора, которая включает в себя лингвистическую модель, базовые механизмы обработки
предложений и ассоциированные процедуры. Предложен аппарат для построения формаль-
ного описания лингвистических моделей, который основан на описании модели знаний
предметной области в виде множества подразумеваемых ситуаций. Поэтому решение задач
представляется в виде преобразований в пространстве ситуаций. Формальное отображение
ситуации описывается продукционными правилами, что позволяет представлять модели в
виде системы продукций, а решение задач строить как доказательство теорем, используя
метод линейной резолюции. На основе предложенного подхода построены модели
морфологического и синтаксического анализов транслятора в виде систем продукций.
      Третья глава посвящена методам трансляции. В ней предложены формальные модели
метаописания базы данных и проблемной среды, которые описываются семейством
множеств закономерностей проблемной среды и концептуальной схемы базы данных,
представленных в виде формул предикатов второго порядка, описаны методы построения
графа, гомеоморфного графу зависимостей естественно-языкового запроса и методы
трансляции естественно-языковых запросов в SQL-запросы к базе данных.
      В заключении приведены основные результаты работы и перспективы развития. В
приложениях приведены структура лингвистических словарей морфологического анализа,
системы продукций синтаксического анализа и система продукций по формированию SQL-
запроса, формальные модели метаописания базы данных и проблемной среды, описание
программного обеспечения и вычислительных экспериментов.

                                         7