Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 111 стр.

UptoLike

существительное, х
i+1
словоформа слова «который», а х
i+2
глагол в любой форме, например,
выпускников, которые закончили, студенты, которые учатся. При этом существительное и глагол
должны стоять в одном и том же числе. В результате формируется словосочетание (х
i
, х
i+2
) с
главным словом х
i
. Для распознавания словоформы слова «который» введем сорт b
6
={который,
которая, которое, которые, которых, которым, которыми, которую, которого, которого, котором,
которой}. Представим правило в виде ситуации: тройка лексем х
i
и х
i+1
и х
i+2
образует пару ГС2
тогда и только тогда, когда имеет место закономерность, описываемая конъюнкцией следующих
фактов:
1) х
i
имеет характеристику v
i1
V
i
со значением «существительное» - (х
i
:X) Р(x
i
, t(v
i1
,
существительное));
2) х
i
имеет характеристику v
i4
со значением сорта «число» - (х
i
:X) Р(x
i
, t(v
i4
, v
i4
));
3) х
i+1
принадлежит сорту b
k
- P
f
(t
in
(x
i+1
), y
1
, f
1
);
4) сорт b
k
имеет значение b
5
- P
E
(y
1
, b
6
);
5) х
i+2
имеет характеристику v
(i+2)1
V
i+2
со значением «глагол» в любой форме - (x
i+2
:X)
Р(x
i+2
, t(v
(i+2)1
, глагол)), или Р(x
i+2
, t(v
(i+2)1
, глагол прошедшего времени)), или Р(x
i+2
, t(v
(i+2)1
, глагол-
отрицание)), или Р(x
i+2
, t(v
(i+2)1
, глагол прошедшего времени-отрицание)), или Р(x
i+2
, t(v
(i+2)1
,
инфинитив-отрицание)), или Р(x
i+2
, t(v
(i+2)1
, инфинитив));
6) х
i+2
имеет характеристику v
(i+2)4
со значением сорта «число» - (х
i+2
:X) Р(x
i+2
, t(v
(i+2)4
, v
i4
));
7) v
i4
должна быть эквивалентна v
(i+2)4
- Р
Е
(v
i4
, v
(i+2)4
).
Тогда продукция для данного правила представляется в виде пары: pr
43
s
=<q
43
s
, r
43
s
>, где
q
43
s
= (х
i
:X) Р(x
i
, t(v
i1
, существительное), t(v
i4
, v
i4
)) P
f
(t
in
(x
i+1
), y
1
, f
1
) P
E
(y
1
, b
6
) (х
i+2
:X)
(Р(x
i+2
, t(v
(i+2)1
, глагол), t(v
(i+2)4
, v
i4
)) Р(x
i+2
, t(v
(i+2)1
, глагол прошедшего времени), t(v
(i+2)4
, v
i4
))
Р(x
i+2
, t(v
(i+2)1
, глагол-отрицание), t(v
(i+2)4
, v
i4
)) Р(x
i+2
, t(v
(i+2)1
, глагол прошедшего времени-
отрицание), t(v
(i+2)4
, v
i4
)) Р(x
i+2
, t(v
(i+2)1
, инфинитив-отрицание), t(v
(i+2)4
, v
i4
)) Р(x
i+2
, t(v
(i+2)1
,
инфинитив), t(v
(i+2)4
, v
i4
))) Р
Е
(v
i4
, v
(i+2)4
) (х
i
:X) (x
i+1
:X) Р
1
(ГС, t(х
i
, x
i+1
));
r
43
s
= add [L
4
(D, (x
i
, x
i+2
)) L
1
(x
i
) L
2
(x
i+2
)]; elim [(X, {x
i+1
})].
Третья подсистема правил:
1. Правило для построения словосочетания ОЧНГ (однородные члены наречия + глагол).
Правило ищет два контактно стоящих слова х
i
и х
i+1
, где х
i
наречие, которое должно входить в
синтаксическую группу ОЧН, а х
i+1
глагол в любой форме или наоборот, например, усердно и
внимательно слушать. В результате для каждого элемента синтаксической группы должно быть
сформировано словосочетание (х
i+1
, х
j
), где х
i+1
это слово, с частью речи глагол, а х
j
- элемент
синтаксической группы ОЧН, кроме исходного х
i
. Так как слова х
i
и х
i+1
могут быть как наречием,
так и глаголом, то данное правило можно представить в виде двух ситуаций.
Ситуация первая: пара лексем х
i
и х
j
через х
i+1
лексему (х
j
,
х
i+1
ОЧН) образует словосочетание
ОЧНГ тогда и только тогда, когда имеет место закономерность, описываемая конъюнкцией
следующих фактов:
1) х
i
имеет характеристику v
i1
V
i
со значением «наречие» - (x
i
:X) Р(x
i
, t(v
i1
, наречие));
2) х
i
лексема входит в состав синтаксической группы ОЧНР
3
(ОЧН, t(х
i
, x
j
)) или Р
4
(ОЧН, t(х
i
,
110
существительное, хi+1 – словоформа слова «который», а хi+2 – глагол в любой форме, например,
выпускников, которые закончили, студенты, которые учатся. При этом существительное и глагол
должны стоять в одном и том же числе. В результате формируется словосочетание (хi, хi+2) с
главным словом хi. Для распознавания словоформы слова «который» введем сорт b6={который,
которая, которое, которые, которых, которым, которыми, которую, которого, которого, котором,
которой}. Представим правило в виде ситуации: тройка лексем хi и хi+1 и хi+2 образует пару ГС2
тогда и только тогда, когда имеет место закономерность, описываемая конъюнкцией следующих
фактов:
      1) хi имеет характеристику vi1∈Vi со значением «существительное» - (∃хi:X) Р(xi, t(vi1,
существительное));
      2) хi имеет характеристику vi4 со значением сорта «число» - (∃хi:X) Р(xi, t(vi4, vi4));
      3) хi+1 принадлежит сорту bk- Pf(tin(xi+1), y1, f1);
      4) сорт bk имеет значение b5 - PE(y1, b6);
      5) хi+2 имеет характеристику v(i+2)1∈Vi+2 со значением «глагол» в любой форме - (∃xi+2:X)
Р(xi+2, t(v(i+2)1, глагол)), или Р(xi+2, t(v(i+2)1, глагол прошедшего времени)), или Р(xi+2, t(v(i+2)1, глагол-
отрицание)), или Р(xi+2, t(v(i+2)1, глагол прошедшего времени-отрицание)), или Р(xi+2, t(v(i+2)1,
инфинитив-отрицание)), или Р(xi+2, t(v(i+2)1, инфинитив));
      6) хi+2 имеет характеристику v(i+2)4 со значением сорта «число» - (∃хi+2:X) Р(xi+2, t(v(i+2)4, vi4));
      7) vi4 должна быть эквивалентна v(i+2)4 - РЕ(vi4, v(i+2)4).
      Тогда продукция для данного правила представляется в виде пары: pr43s =, где
      q43 s = (∃хi:X) Р(xi, t(vi1, существительное), t(vi4, vi4)) ∧ Pf(tin(xi+1), y1, f1) ∧ PE(y1, b6) ∧ (∃хi+2:X)
(Р(xi+2, t(v(i+2)1, глагол), t(v(i+2)4, vi4)) ∨ Р(xi+2, t(v(i+2)1, глагол прошедшего времени), t(v(i+2)4, vi4)) ∨
Р(xi+2, t(v(i+2)1, глагол-отрицание), t(v(i+2)4, vi4)) ∨ Р(xi+2, t(v(i+2)1, глагол прошедшего времени-
отрицание), t(v(i+2)4, vi4)) ∨ Р(xi+2, t(v(i+2)1, инфинитив-отрицание), t(v(i+2)4, vi4)) ∨ Р(xi+2, t(v(i+2)1,
инфинитив), t(v(i+2)4, vi4))) ∧ РЕ(vi4, v(i+2)4) ↔ (∃хi:X) (∃xi+1:X) Р1(ГС, t(хi, xi+1));
      r43 s = add [L4(D, (xi, xi+2)) ∧ L1(xi) ∧ L2(xi+2)]; elim [(X, {xi+1})].

      Третья подсистема правил:
      1. Правило для построения словосочетания ОЧНГ (однородные члены наречия + глагол).
Правило ищет два контактно стоящих слова хi и хi+1, где хi – наречие, которое должно входить в
синтаксическую группу ОЧН, а хi+1 – глагол в любой форме или наоборот, например, усердно и
внимательно слушать. В результате для каждого элемента синтаксической группы должно быть
сформировано словосочетание (хi+1, хj), где хi+1 – это слово, с частью речи глагол, а хj - элемент
синтаксической группы ОЧН, кроме исходного хi. Так как слова хi и хi+1 могут быть как наречием,
так и глаголом, то данное правило можно представить в виде двух ситуаций.
      Ситуация первая: пара лексем хi и хj через хi+1 лексему (хj, хi+1∈ОЧН) образует словосочетание
ОЧНГ тогда и только тогда, когда имеет место закономерность, описываемая конъюнкцией
следующих фактов:
      1) хi имеет характеристику vi1∈Vi со значением «наречие» - (∃xi:X) Р(xi, t(vi1, наречие));
      2) хi лексема входит в состав синтаксической группы ОЧН – Р3(ОЧН, t(хi, xj)) или Р4(ОЧН, t(хi,

                                                       110