Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 57 стр.

UptoLike

57
предикатов. Посредством параметрического предиката будем описывать отношения
агрегации и характеризации, задавая при этом схему понятия (сущности) через
перечисление его свойств (атрибутов) и признаков этих свойств:
P
par
(х, t(p
1
,v
k1
1
), …, t(p
i
,v
j
i
), …, t(p
m
,v
k2
m
)),
(3.1)
где
хсущность в терминах физической модели данных; t(p
i
,v
j
i
) – терм, задающий
отношение характеризации в виде соответствия между
p
i
идентификатором атрибута
физической модели данных и его
j-тым признаком v
j
i
; mколичество атрибутов,
составляющих сущность
х.
Составные предикаты используются для описания отношений типизации, перевода и
конкретизации.
Первый составной предикат описывает отношения типизации, перевода и
конкретизации между двумя объектами биноминативного предложения:
P
s
(x, y, t
r
),
(3.2)
где
xпервый объект биноминативного предложения, yвторой объект
биноминативного предложения,
t
r
тип отношения r между ними.
Второй составной предикат позволяет описывать отношения типизации и перевода
между двумя объектами биноминативного предложения, первый из которых
представляется в виде множества понятий естественного языка:
P
s
(t(x
1
,…,x
n
), y, t
r
),
(3.3)
где
t(x
1
,…,x
n
) – терм, задающий множество понятий естественного языка (x
1
,…,x
n
),
которые в совокупности определяют второй объект биноминативного предложения
y, t
r
тип отношения
r между ними.
Знания об элементах базы данных подразделяются на три группы
1
: первая включает в
себя знания о понятиях логической модели данных, втораязнания о взаимосвязи
терминов логической и физической моделей данных, третьязнания о понятиях
физической модели данных. Знания о моделях данных содержат знания об интенсионале
понятий, о типах данных и лексических характеристиках атрибутов базы данных.
Для описания знаний первой группы используются составные предикаты с
отношениями: типизации
r
tip
t
агрегации и обобщения
r
agr
t
, которые позволяют задать
понятия, составляющие логическую модель данных, и их свойства. Вторая группа
описывается составным предикатом с отношением перевода
r
tr
t . С помощью этого
предиката устанавливается соответствие между терминами логической и физической
моделей данных. Для описания третьей группы используются составной предикат с
отношением конкретизации
r
con
t и параметрический предикат. Посредством составного
предиката уточняется термин физической модели данных. Каждому термину могут быть
приписаны: тип данных, запись данных и лексическая характеристика. Параметрический
предикат задает схему понятиятермина физической модели, а валентные признаки
понятия позволяют создать семантическую сеть понятий.
Приведем примеры предикатов, которые соответствуют метаописанию модели
данных «Контингент студентов»:
1)
),,(
r
tips
tyxP - предикат, задающий отношение типизации
r
tip
t , например, предикат
1
Три группы предикатов, соответствующие знаниям об элементах базы данных, приведены в Приложении В.
предикатов. Посредством параметрического предиката будем описывать отношения
агрегации и характеризации, задавая при этом схему понятия (сущности) через
перечисление его свойств (атрибутов) и признаков этих свойств:
                    Ppar(х, t(p1,v k11), …, t(pi,vji), …, t(pm,v k2 m)),          (3.1)
                                                                         i
     где х – сущность в терминах физической модели данных; t(pi,vj ) – терм, задающий
отношение характеризации в виде соответствия между pi – идентификатором атрибута
физической модели данных и его j-тым признаком vji; m – количество атрибутов,
составляющих сущность х.
     Составные предикаты используются для описания отношений типизации, перевода и
конкретизации.
     Первый составной предикат описывает отношения типизации, перевода и
конкретизации между двумя объектами биноминативного предложения:
                                        Ps(x, y, tr),                             (3.2)
     где x – первый объект биноминативного предложения, y – второй объект
биноминативного предложения, tr – тип отношения r между ними.
     Второй составной предикат позволяет описывать отношения типизации и перевода
между двумя объектами биноминативного предложения, первый из которых
представляется в виде множества понятий естественного языка:
                                  Ps(t(x1,…,xn), y, tr),                          (3.3)
     где t(x1,…,xn) – терм, задающий множество понятий естественного языка (x1,…,xn),
которые в совокупности определяют второй объект биноминативного предложения y, tr –
тип отношения r между ними.
     Знания об элементах базы данных подразделяются на три группы1: первая включает в
себя знания о понятиях логической модели данных, вторая – знания о взаимосвязи
терминов логической и физической моделей данных, третья – знания о понятиях
физической модели данных. Знания о моделях данных содержат знания об интенсионале
понятий, о типах данных и лексических характеристиках атрибутов базы данных.
     Для описания знаний первой группы используются составные предикаты с
                          r                          r
отношениями: типизации t tip агрегации и обобщения t agr , которые позволяют задать
понятия, составляющие логическую модель данных, и их свойства. Вторая группа
описывается составным предикатом с отношением перевода t trr . С помощью этого
предиката устанавливается соответствие между терминами логической и физической
моделей данных. Для описания третьей группы используются составной предикат с
                           r
отношением конкретизации t con и параметрический предикат. Посредством составного
предиката уточняется термин физической модели данных. Каждому термину могут быть
приписаны: тип данных, запись данных и лексическая характеристика. Параметрический
предикат задает схему понятия – термина физической модели, а валентные признаки
понятия позволяют создать семантическую сеть понятий.
     Приведем примеры предикатов, которые соответствуют метаописанию модели
данных «Контингент студентов»:
                         r                                                r
        1) Ps ( x, y, t tip ) - предикат, задающий отношение типизации t tip , например, предикат


1
    Три группы предикатов, соответствующие знаниям об элементах базы данных, приведены в Приложении В.
                                                   57