Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 54 стр.

UptoLike

54
3. Модель трансляции
В данном разделе необходимо описать два последних преобразования Ψ
3
: GG
~
и Ψ
4
:
G
~
Q, где G - граф зависимостей, в вершинах которого располагаются словоформы
(лексемы), полученные в результате выполнения морфологического и синтаксического
анализов,
G
~
- граф зависимостей в терминах физической модели данных, Q - SQL-запрос.
Для построения Ψ
3
необходимо выполнить два последовательных преобразования:
GGG
~
~
33
→
→
Ψ
Ψ
, где G - граф зависимостей синтаксического анализа естественно-
языкового запроса,
G
~
- граф зависимостей в терминах логической модели данных, G
~
- граф
зависимостей в терминах физической модели данных.
Для построения Ψ
4
необходимо выполнить преобразования:
QGG →→
Ψ
Ψ
44
~
, где
G
~
- граф зависимостей в терминах физической модели данных, G - граф SQL-запроса, Q -
SQL-запрос.
Для выполнения преобразований необходимо рассмотреть структуру
лингвистического обеспечения, описанного в разделе 3.1, преобразование Ψ
3
рассмотрено в
разделе 3.2 и преобразование Ψ
4
в разделе 3.3.
3.1. Интерпретационная модель лингвистического транслятора
Интерпретационная модель включает в себя метаописание базы данных и формальное
описание проблемной среды.
3.1.1. Метаописание базы данных
Метаописание базы данных представляет собой описание её концептуальной схемы.
Описание концептуальной схемы базы данных состоит из: знаний об элементах базы
данных и структуре базы данных; знаний о взаимосвязи понятий базы данных с понятиями
естественного языка.
Приведем основные понятия и их определения.
Понятие в формальной логикеэлементарная единица мыслительной деятельности,
обладающая известной целостностью и устойчивостью и взятая в отвлечении от словесного
выражения этой деятельности [88]. Понятиеэто то, что выражается (или обозначается)
любой значащей (самостоятельной) частью речи (кроме местоимений), а если перейти от
масштабов языка в целом к "микроуровню", то членом предложения. Для трактовки
проблемы понятия в её формально-логическом аспекте можно воспользоваться готовым
арсеналом трёх областей современного знания: общей алгебры, логической семантики,
математической логики.
Процесс образования понятия естественно описывается в терминах гомоморфизма.
Разбивая множество объектов на классы "эквивалентных" в каком-либо отношении
элементов, т.е. игнорируя все различия между элементами одного класса, не являющимися
существенными для рассматриваемой предметной области, получаем новое множество.
Множество, полученное по выделенному отношению эквивалентности, гомоморфно
исходному и называется фактор-множество. Тогда элементы этого нового множества
(классы эквивалентности) можно воспринимать как единые, не расчленяемые объекты,
полученные в результате "склеивания" всех неразличимых в фиксированных отношениях
исходных объектов в один "комок". Эти "комки" отождествленных между собой образов
                            3. Модель трансляции
                                                                                 ~
     В данном разделе необходимо описать два последних преобразования Ψ3: G→ G и Ψ4:
 ~
G →Q, где G - граф зависимостей, в вершинах которого располагаются словоформы
(лексемы), полученные в результате выполнения морфологического и синтаксического
           ~
анализов, G - граф зависимостей в терминах физической модели данных, Q - SQL-запрос.
     Для построения Ψ3 необходимо выполнить два последовательных преобразования:
   Ψ′3 ~ Ψ3′′ ~
    G′ →
G →     G      , где G - граф зависимостей синтаксического анализа естественно-
                   ~                                                            ~
языкового запроса, G ′ - граф зависимостей в терминах логической модели данных, G - граф
зависимостей в терминах физической модели данных.
                                                                  ~
                                                                 Ψ′4   Ψ4′′
       Для построения Ψ4 необходимо выполнить преобразования: G      → Q , где
                                                                 → G 
~
G-  граф зависимостей в терминах физической модели данных, G - граф SQL-запроса, Q -
SQL-запрос.
      Для     выполнения     преобразований      необходимо    рассмотреть    структуру
лингвистического обеспечения, описанного в разделе 3.1, преобразование Ψ3 рассмотрено в
разделе 3.2 и преобразование Ψ4 – в разделе 3.3.
3.1.    Интерпретационная модель лингвистического транслятора
     Интерпретационная модель включает в себя метаописание базы данных и формальное
описание проблемной среды.
3.1.1. Метаописание базы данных
     Метаописание базы данных представляет собой описание её концептуальной схемы.
Описание концептуальной схемы базы данных состоит из: знаний об элементах базы
данных и структуре базы данных; знаний о взаимосвязи понятий базы данных с понятиями
естественного языка.
     Приведем основные понятия и их определения.
     Понятие в формальной логике – элементарная единица мыслительной деятельности,
обладающая известной целостностью и устойчивостью и взятая в отвлечении от словесного
выражения этой деятельности [88]. Понятие – это то, что выражается (или обозначается)
любой значащей (самостоятельной) частью речи (кроме местоимений), а если перейти от
масштабов языка в целом к "микроуровню", то членом предложения. Для трактовки
проблемы понятия в её формально-логическом аспекте можно воспользоваться готовым
арсеналом трёх областей современного знания: общей алгебры, логической семантики,
математической логики.
     Процесс образования понятия естественно описывается в терминах гомоморфизма.
Разбивая множество объектов на классы "эквивалентных" в каком-либо отношении
элементов, т.е. игнорируя все различия между элементами одного класса, не являющимися
существенными для рассматриваемой предметной области, получаем новое множество.
Множество, полученное по выделенному отношению эквивалентности, гомоморфно
исходному и называется фактор-множество. Тогда элементы этого нового множества
(классы эквивалентности) можно воспринимать как единые, не расчленяемые объекты,
полученные в результате "склеивания" всех неразличимых в фиксированных отношениях
исходных объектов в один "комок". Эти "комки" отождествленных между собой образов

                                          54