Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 59 стр.

UptoLike

59
6)
),,(
r
cons
tyxP
- предикат, задающий отношение конкретизации
r
con
t
. Например,
предикат
),,(
r
cons
tдатаBirthDayP
утверждает, что термин физической модели данных
BirthDay имеет лексическую характеристику «признак синтаксической группы» - ДАТА.
Таким образом, каждая группа знаний об элементах базы данных включает в себя
следующие типы предикатов:
· первая группа знаний - множество предикатов типизации вида
),,(
r
tips
tyxP и
),),,...,((
1
r
tipks
tyxxtP ;
· вторая группа знаний - множество параметрических предикатов
)),(),...,,(),...,,(,(
2
1
11
m
km
i
jikpar
vptvptvptxP
, задающих отношения агрегации и характеризации,
а также множество предикатов конкретизации
),,(
r
cons
tyxP
;
· третья группа знаний - множество предикатов перевода ),,(
r
trs
tyxP и
),),,...,((
1
r
trks
tyxxtP .
3.1.2. Описание знаний проблемной среды
Знания проблемной среды можно разделить на две категории: знания, которые имеют
прямое отношение к базе данных; знания, имеющие косвенное отношение к базе данных.
Знания, имеющие прямое отношение к базе данных, представляют собой понятия на
естественном языке, которые находятся в отношении перевода с терминами логической и
физической модели данных. Логические операции, операторы SQL-запроса, агрегатные
функции составляют знания об языке SQL-ориентированных баз данных.
К знаниям, имеющим прямое отношение к базе данных, относятся:
- знания об определениях терминов логической модели данных и понятий
естественного языка, релевантных проблемной среде;
- специальные знания, относящиеся к устройству рассматриваемой системы
(транслятора), или знания о себе.
К знаниям, имеющим косвенное отношение к базе данных, относятся:
- знания о синонимах терминов логической модели данных и понятий естественного
языка, релевантных проблемной среде;
- знания, составляющие базовую модель и не относящиеся к проблемной среде.
Специальные знания составляют понятия, концепт которых связан с логическими
операциями (операндами SQL-запроса), операторами SQL-запроса или стандартными
агрегатными функциями, которые определяются служебными терминами SQL-
ориентированной базы данных.
Все знания проблемной среды составляют множество
Ξ
s
множество терминов
проблемной среды и описываются в виде закономерностей на основе различных типов
отношений (прямых и обратных), которые разбиты на восемь групп:
1) отношение тождества между понятием проблемной среды и понятием логической
модели данных;
2) отношение подобия между понятием логической модели данных и понятием-
синонимом проблемной среды;
3) отношение подобия между понятием естественного языка, релевантным
                         r                                                    r
         6) Ps ( x, y, t con ) - предикат, задающий отношение конкретизации t con . Например,
                                              r
предикат Ps ( BirthDay, дата, t con ) утверждает, что термин физической модели данных
BirthDay имеет лексическую характеристику «признак синтаксической группы» - ДАТА.
     Таким образом, каждая группа знаний об элементах базы данных включает в себя
следующие типы предикатов:
                                                                                        r
         ·     первая группа знаний - множество предикатов типизации вида Ps ( x, y, t tip ) и
                              r
Ps (t ( x1 ,..., x k ), y, t tip );
         ·     вторая              группа     знаний            -   множество    параметрических      предикатов
                      1                i              m
Ppar ( x, t ( p1 , v ),..., t ( pi , v ),..., t ( p m , v ))
                      k1               j              k2
                                                               , задающих отношения агрегации и характеризации,
                                                        r
а также множество предикатов конкретизации Ps ( x, y, t con ) ;
         ·     третья группа знаний - множество предикатов перевода                                Ps ( x, y, t trr ) и
Ps (t ( x1 ,..., x k ), y, t trr ) .

3.1.2. Описание знаний проблемной среды
     Знания проблемной среды можно разделить на две категории: знания, которые имеют
прямое отношение к базе данных; знания, имеющие косвенное отношение к базе данных.
     Знания, имеющие прямое отношение к базе данных, представляют собой понятия на
естественном языке, которые находятся в отношении перевода с терминами логической и
физической модели данных. Логические операции, операторы SQL-запроса, агрегатные
функции составляют знания об языке SQL-ориентированных баз данных.
     К знаниям, имеющим прямое отношение к базе данных, относятся:
     - знания об определениях терминов логической модели данных и понятий
естественного языка, релевантных проблемной среде;
     - специальные знания, относящиеся к устройству рассматриваемой системы
(транслятора), или знания о себе.
     К знаниям, имеющим косвенное отношение к базе данных, относятся:
     - знания о синонимах терминов логической модели данных и понятий естественного
языка, релевантных проблемной среде;
     - знания, составляющие базовую модель и не относящиеся к проблемной среде.
     Специальные знания составляют понятия, концепт которых связан с логическими
операциями (операндами SQL-запроса), операторами SQL-запроса или стандартными
агрегатными функциями, которые определяются служебными терминами SQL-
ориентированной базы данных.
     Все знания проблемной среды составляют множество Ξs – множество терминов
проблемной среды и описываются в виде закономерностей на основе различных типов
отношений (прямых и обратных), которые разбиты на восемь групп:
     1) отношение тождества между понятием проблемной среды и понятием логической
модели данных;
     2) отношение подобия между понятием логической модели данных и понятием-
синонимом проблемной среды;
     3) отношение подобия между понятием естественного языка, релевантным

                                                                    59