Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 61 стр.

UptoLike

61
утверждает, что концепт понятия контактные данные составляют понятия z
1
, z
2
, z
3
∈Ξ
l
(телефон, факс, e-mail);
- P
s
(x, y, r(verb),t(z
1
, …,z
k
),
r
fun
t ), - предикат, задающий отношение номинации между
понятием х и тремя следующими аргументами предиката y, r(verb), ),...,(
1 k
zzt . При этом
r(verb) задает функциональное отношение между понятием y и термом ),...,(
1 k
zzt
посредством глагола verb. Глагол определяет смысл между понятием y и понятиями
естественного языка
k
zz ,...,
1
, которые могут принадлежать множеству терминов логической
модели данных z
i
∈Ξ
l
или множеству понятий, релевантных проблемной среде z
j
∈Ξ
s
.
Например, предикат
)),(),(,,(
r
noms
tпризнаксоциальныйtиметьrстудентльготникP
утверждает, что
концепт понятия льготник определяется через понятие студент и понятие студент имеет
свойство «социальный признак»;
-
),,(
r
tips
tyxP - предикат, задающий отношение типизации
r
tip
t , например, предикат
),,(
r
tips
tоперациябольшеP утверждает, что термин больше∈Ξ
s
и является операцией оператора
SQL, а предикат
),,(
r
tips
tпроцедураьнаявычислителсреднийP утверждает, что термин
средний
∈Ξ
s
является вычислительной процедурой оператора SQL;
- ),,(
r
trs
tyxP - предикат, задающий отношение перевода
r
tr
t , например, предикат
),,(
r
trs
tбольшеP >
утверждает, что термин больше соответствует логической операции «>»,а
предикат ),,(
r
trs
tselectвыдатьP утверждает, что термин выдать соответствует операнду
Select оператора языка запросов SQL;
- P
s
(x, t(z
1
, …,z
k
),
r
agr
t ), - предикат, задающий отношение агрегации
r
agr
t между
понятием - атрибутом логической модели данных х∈Ξ
l
и термом ),...,(
1 k
zzt . Вектор
значений ),...,(
1 k
zz определяет объем понятия х. Например: предикат P
s
(социальный
признак, t(сирота, инвалид 1 группы, инвалид 2 группы, инвалид 3 группы, из многодетной
семьи, участник ликвидации аварии Чернобыльской АЭС, участник войны в Афганистане,
участник войны в Чечне, мать-одиночка), t
r
agr
) утверждает, что понятия сирота, инвалид и
т.д. составляют объем понятия социальный признак∈Ξ
l
.
Таким образом, знания проблемной среды можно разделить на четыре основные
группы:
- первая группа включает в себя знания об определениях терминов логической
модели данных и понятий естественного языка, релевантных проблемной среде, которые
описываются предикатами отношения номинации вида: P
s
(x, y, r(verb),t(z
1
, …,z
k
),
r
fun
t ) и
P
s
(x, t(z
1
, …,z
k
),
r
nom
t ), а также предикатами, задающими отношение агрегации P
s
(x,t(z
1
,.,z
k
),
r
agr
t );
- вторая группа знаний включает в себя специальные знания проблемной среды,
которые описываются предикатами типизации
),,(
r
tips
tyxP и перевода
),,(
r
trs
tyxP
;
- третья группа знаний включает в себя знания о синонимах терминов логической
модели данных и понятий естественного языка, релевантных проблемной среде, которым
соответствуют предикаты с отношениями тождества вида
),,(
r
tgs
tyxP
или
утверждает, что концепт понятия контактные данные составляют понятия z1, z2, z3 ∈Ξl
(телефон, факс, e-mail);
           -   Ps(x, y, r(verb),t(z1, …,zk), t rfun ), - предикат, задающий отношение номинации между
понятием х и тремя следующими аргументами предиката y, r(verb), t ( z1 ,..., z k ) . При этом
r(verb) задает функциональное отношение между понятием y и термом t ( z1 ,..., z k )
посредством глагола verb. Глагол определяет смысл между понятием y и понятиями
естественного языка z1,..., zk , которые могут принадлежать множеству терминов логической
модели данных zi∈Ξl или множеству понятий, релевантных проблемной среде zj∈Ξs.
Например, предикат Ps ( льготник, студент, r (иметь), t (социальный признак), t nom
                                                                                r
                                                                                    ) утверждает, что
концепт понятия льготник определяется через понятие студент и понятие студент имеет
свойство «социальный признак»;
                             r                                                r
           -   Ps ( x, y, t tip ) - предикат, задающий отношение типизации t tip , например, предикат
                        r
Ps (больше, операция , ttip )   утверждает, что термин больше∈Ξs и является операцией оператора
                                                          r
SQL, а предикат Ps (средний, вычислительная процедура, t tip ) утверждает, что термин
средний∈Ξs является вычислительной процедурой оператора SQL;
           -   Ps ( x, y, t trr ) - предикат, задающий отношение перевода t trr , например, предикат
Ps (больше, >, t trr ) утверждает, что термин больше соответствует логической операции «>»,а
предикат Ps (выдать, select, t trr ) утверждает, что термин выдать соответствует операнду
Select оператора языка запросов SQL;
                                    r                                                 r
           -   Ps(x, t(z1, …,zk), t agr ), - предикат, задающий отношение агрегации t agr между
понятием - атрибутом логической модели данных х∈Ξl и термом t ( z1 ,..., z k ) . Вектор
значений ( z1 ,..., z k ) определяет объем понятия х. Например: предикат Ps(социальный
признак, t(сирота, инвалид 1 группы, инвалид 2 группы, инвалид 3 группы, из многодетной
семьи, участник ликвидации аварии Чернобыльской АЭС, участник войны в Афганистане,
участник войны в Чечне, мать-одиночка), tragr) утверждает, что понятия сирота, инвалид и
т.д. составляют объем понятия социальный признак∈Ξl.
      Таким образом, знания проблемной среды можно разделить на четыре основные
группы:
      - первая группа включает в себя знания об определениях терминов логической
модели данных и понятий естественного языка, релевантных проблемной среде, которые
описываются предикатами отношения номинации вида: Ps(x, y, r(verb),t(z1, …,zk), t rfun ) и
                     r
Ps(x, t(z1, …,zk), t nom ), а также предикатами, задающими отношение агрегации Ps(x,t(z1,.,zk),
  r
t agr );
           -   вторая группа знаний включает в себя специальные знания проблемной среды,
                                                        r
которые описываются предикатами типизации Ps ( x, y, t tip ) и перевода Ps ( x, y, t trr ) ;
     - третья группа знаний включает в себя знания о синонимах терминов логической
модели данных и понятий естественного языка, релевантных проблемной среде, которым
соответствуют            предикаты       с   отношениями     тождества     вида     Ps ( x, y, t tgr )   или

                                                    61