ВУЗ:
Составители:
Рубрика:
7
который после ряда последовательных преобразований содержит информацию,
необходимую для построения SQL-запроса.
База знаний, необходимая для выполнения анализа запроса, содержит метаописание
базы данных и знания проблемной среды. Модуль метаописания БД состоит из описания
концептуальной схемы базы данных на естественном языке: сущностей, атрибутов и связей
между сущностями. Модуль словарей содержит знания для проведения морфологического,
синтаксического анализов и трансляции естественно-языковых запросов к базе данных.
Модуль знаний проблемной среды содержит описания понятий и терминов предметной
области. Создаваемую естественно-языковую систему обработки запросов к базе данных
предполагается использовать при разработке больших информационных систем. База
знаний должна заполняться в процессе разработки проекта информационной системы.
Поскольку у многих информационных систем основным ядром является SQL-
ориентированные распределенные базы данных, то задача построения естественно-
языкового пользовательского интерфейса тесно связана с разработкой методов и
алгоритмов трансляции естественно-языковых запросов в запросы SQL языка. Таким
образом, предмет рассмотрения этой работы – методы, позволяющие осуществлять
преобразование запросов на естественном языке, представленных в виде простых
предложений русского языка, в SQL-запросы.
Работа состоит из введения, трех глав, заключения, литературы и 6 приложений.
В первой главе дан обзор существующих моделей лингвистического анализатора,
рассмотрена структура лингвистического анализатора, проанализированы методы и
алгоритмы морфологического, синтаксического и проблемного анализов, сделаны
основные выводы и сформулирована постановка задачи.
Во второй главе рассматривается математическая модель лингвистического трансля-
тора, которая включает в себя лингвистическую модель, базовые механизмы обработки
предложений и ассоциированные процедуры. Предложен аппарат для построения формаль-
ного описания лингвистических моделей, который основан на описании модели знаний
предметной области в виде множества подразумеваемых ситуаций. Поэтому решение задач
представляется в виде преобразований в пространстве ситуаций. Формальное отображение
ситуации описывается продукционными правилами, что позволяет представлять модели в
виде системы продукций, а решение задач строить как доказательство теорем, используя
метод линейной резолюции. На основе предложенного подхода построены модели
морфологического и синтаксического анализов транслятора в виде систем продукций.
Третья глава посвящена методам трансляции. В ней предложены формальные модели
метаописания базы данных и проблемной среды, которые описываются семейством
множеств закономерностей проблемной среды и концептуальной схемы базы данных,
представленных в виде формул предикатов второго порядка, описаны методы построения
графа, гомеоморфного графу зависимостей естественно-языкового запроса и методы
трансляции естественно-языковых запросов в SQL-запросы к базе данных.
В заключении приведены основные результаты работы и перспективы развития. В
приложениях приведены структура лингвистических словарей морфологического анализа,
системы продукций синтаксического анализа и система продукций по формированию SQL-
запроса, формальные модели метаописания базы данных и проблемной среды, описание
программного обеспечения и вычислительных экспериментов.
который после ряда последовательных преобразований содержит информацию, необходимую для построения SQL-запроса. База знаний, необходимая для выполнения анализа запроса, содержит метаописание базы данных и знания проблемной среды. Модуль метаописания БД состоит из описания концептуальной схемы базы данных на естественном языке: сущностей, атрибутов и связей между сущностями. Модуль словарей содержит знания для проведения морфологического, синтаксического анализов и трансляции естественно-языковых запросов к базе данных. Модуль знаний проблемной среды содержит описания понятий и терминов предметной области. Создаваемую естественно-языковую систему обработки запросов к базе данных предполагается использовать при разработке больших информационных систем. База знаний должна заполняться в процессе разработки проекта информационной системы. Поскольку у многих информационных систем основным ядром является SQL- ориентированные распределенные базы данных, то задача построения естественно- языкового пользовательского интерфейса тесно связана с разработкой методов и алгоритмов трансляции естественно-языковых запросов в запросы SQL языка. Таким образом, предмет рассмотрения этой работы – методы, позволяющие осуществлять преобразование запросов на естественном языке, представленных в виде простых предложений русского языка, в SQL-запросы. Работа состоит из введения, трех глав, заключения, литературы и 6 приложений. В первой главе дан обзор существующих моделей лингвистического анализатора, рассмотрена структура лингвистического анализатора, проанализированы методы и алгоритмы морфологического, синтаксического и проблемного анализов, сделаны основные выводы и сформулирована постановка задачи. Во второй главе рассматривается математическая модель лингвистического трансля- тора, которая включает в себя лингвистическую модель, базовые механизмы обработки предложений и ассоциированные процедуры. Предложен аппарат для построения формаль- ного описания лингвистических моделей, который основан на описании модели знаний предметной области в виде множества подразумеваемых ситуаций. Поэтому решение задач представляется в виде преобразований в пространстве ситуаций. Формальное отображение ситуации описывается продукционными правилами, что позволяет представлять модели в виде системы продукций, а решение задач строить как доказательство теорем, используя метод линейной резолюции. На основе предложенного подхода построены модели морфологического и синтаксического анализов транслятора в виде систем продукций. Третья глава посвящена методам трансляции. В ней предложены формальные модели метаописания базы данных и проблемной среды, которые описываются семейством множеств закономерностей проблемной среды и концептуальной схемы базы данных, представленных в виде формул предикатов второго порядка, описаны методы построения графа, гомеоморфного графу зависимостей естественно-языкового запроса и методы трансляции естественно-языковых запросов в SQL-запросы к базе данных. В заключении приведены основные результаты работы и перспективы развития. В приложениях приведены структура лингвистических словарей морфологического анализа, системы продукций синтаксического анализа и система продукций по формированию SQL- запроса, формальные модели метаописания базы данных и проблемной среды, описание программного обеспечения и вычислительных экспериментов. 7
Страницы
- « первая
- ‹ предыдущая
- …
- 5
- 6
- 7
- 8
- 9
- …
- следующая ›
- последняя »