Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 98 стр.

UptoLike

соответствующая группа ОЧ, слова х
i+1
, х
i+2
, х
i+3
удаляются из исходного множества лексем. Далее
для поиска пары будет анализироваться только слово х
i
, а для остальных по умолчанию
сформируются пары со словом, которое будет согласовано с х
i
словом. Нахождение однородных
членов предложения для каждой части речи можно представить в виде шести ситуаций.
Ситуация первая - правило первое: лексемы х
i,
х
j
, х
t
и х
k
образуют синтаксическую группу
ОЧС (однородные члены существительные) тогда и только тогда, когда имеет место
закономерность, описываемая конъюнкцией следующих фактов:
1) х
i
имеет характеристику v
i1
V
i
со значением «существительное» - (х
i
:X) Р(x
i
, t(v
i1
,
существительное));
2) х
i
имеет характеристику v
i5
V
i
со значением сорта «падеж» - (х
i
:X) Р(x
i
, t(v
i5
, v
i5
)) ;
3) х
j
имеет характеристику v
j1
V
j
со значением «существительное» - (х
j
:X) Р(x
j
, t(v
j1
,
существительное));
4) х
j
имеет характеристику v
j5
V
j
со значением сорта «падеж» - (х
j
:X) Р(x
j
, t(v
j5
, v
j5
));
5) х
t
имеет характеристику v
t1
V
t
со значением сорта «часть речи» - (х
t
:X) Р(x
t
, t(v
t1
, v
t1
));
6) v
t1
имеет значение «союз» - P
E
(v
t1
, союз);
7) лексема х
i
стоит раньше х
t
лексемы - P
f
(t
in
(i, t), y
2
, f
2
);
8) у
2
имеет значение «раньше» - Р
Е
(у
2
, раньше);
9) х
k
имеет характеристику v
k1
V
k
со значением «существительное» - (x
k
:X) Р(x
k
, t(v
k1
,
существительное));
10) х
k
имеет характеристику v
k5
V
k
со значением сорта «падеж» - (х
k
:X) Р(x
k
, t(v
k5
, v
k5
));
11) v
i5
, v
j5
и v
k5
должны быть эквивалентны - Р
Е
(v
i5
, v
j5
, v
k5
).
Тогда продукция записывается в виде: pr
4
s
=<q
4
s
, r
4
s
>, где
q
4
s
= (х
i
:X) Р
par
(x
i
, t(v
i1
, существительное), t(v
i5
, v
i5
)) (х
j
:X) Р
par
(x
j
, t(v
j1
, существительное),
t(v
j5
, v
j5
)) (х
t
:X) Р(x
t
, t(v
t1
, v
t1
)) P
E
(v
t1
, союз) P
f
(t
in
(i, t), y
2
, f
2
) Р
Е
(у
2
, раньше) (х
k
:X) Р
par
(x
k
,
t(v
k1
, существительное), t(v
k5
, v
k5
)) Р
Е
(v
i5
, v
j5
, v
k5
) (х
i
:X) (x
j
:X) (x
k
:X) Р
2
(ОЧС, t(x
j
, x
k
, х
i
));
r
4
s
= add [P
4
(ОЧС, t(х
i
, x
j
, x
k
)]; elim [(X, {х
j
, x
k
, x
t
}].
Правило второе первой ситуации рассматривает четыре лексемы х
i,
х
j
, х
t
и х
k
, две из которых х
i
и х
j
удовлетворяют фактам 1)-4) первого правила, третья х
t
удовлетворяет фактам 5)-8), а четвертая
х
k
не должна удовлетворять факту 9. Тогда продукция для данного правила описывается в виде
двойки: pr
5
s
=<q
5
s
, r
5
s
>, где
q
5
s
= (х
i
:X) Р
par
(x
i
, t(v
i1
, существительное), t(v
i5
, v
i5
)) (х
j
:X) Р
par
(x
j
, t(v
j1
, существительное),
t(v
j5
, v
j5
)) (х
t
:X) Р(x
t
, t(v
t1
, v
t1
)) P
E
(v
t1
, союз) P
f
(t
in
(i, t), y
2
, f
2
) Р
Е
(у
2
, раньше)
)),(,(
1
льноесуществитеvtxP
kk
Р
Е
(v
i5
, v
j5
) (х
i
:X) (x
j
:X) Р
1
(ОЧС, t(x
j
, х
i
));
r
5
s
= add [P
3
(ОЧС, t(х
i
, x
j
)]; elim [(X, {х
j
, x
t
}].
Правило третье первой ситуации рассматривает три лексемы х
i,
х
j
и х
k
, а продукция
описывается в виде двойки: pr
6
s
=<q
6
s
, r
6
s
>, где
q
6
s
= (х
i
:X) Р
par
(x
i
, t(v
i1
, существительное), t(v
i5
, v
i5
)) (х
j
:X) Р
par
(x
j
, t(v
j1
, существительное),
t(v
j5
, v
j5
))
)),(,(
1
льноесуществитеvtxP
kk
Р
Е
(v
i5
, v
j5
) (х
i
:X) (x
j
:X) Р
1
(ОЧС, t(x
j
, х
i
));
r
6
s
= add [P
3
(ОЧС, t(х
i
, x
j
)]; elim [(X, {х
j
}].
97
соответствующая группа ОЧ, слова хi+1, хi+2, хi+3 удаляются из исходного множества лексем. Далее
для поиска пары будет анализироваться только слово хi, а для остальных по умолчанию
сформируются пары со словом, которое будет согласовано с хi словом. Нахождение однородных
членов предложения для каждой части речи можно представить в виде шести ситуаций.
        Ситуация первая - правило первое: лексемы хi, хj, хt и хk образуют синтаксическую группу
ОЧС (однородные члены существительные) тогда и только тогда, когда имеет место
закономерность, описываемая конъюнкцией следующих фактов:
        1) хi имеет характеристику vi1∈Vi со значением «существительное» - (∃хi:X) Р(xi, t(vi1,
существительное));
        2) хi имеет характеристику vi5 ∈Vi со значением сорта «падеж» - (∃хi:X) Р(xi, t(vi5, vi5)) ;
        3) хj имеет характеристику vj1∈Vj со значением «существительное» - (∃хj:X) Р(xj, t(vj1,
существительное));
        4) хj имеет характеристику vj5 ∈Vj со значением сорта «падеж» - (∃хj:X) Р(xj, t(vj5, vj5));
        5) хt имеет характеристику vt1∈Vt со значением сорта «часть речи» - (∃хt:X) Р(xt, t(vt1, vt1));
        6) vt1 имеет значение «союз» - PE(vt1, союз);
        7) лексема хi стоит раньше хt лексемы - Pf(tin(i, t), y2, f2);
        8) у2 имеет значение «раньше» - РЕ(у2, раньше);
        9) хk имеет характеристику vk1∈Vk со значением «существительное» - (∃xk:X) Р(xk, t(vk1,
существительное));
        10) хk имеет характеристику vk5 ∈Vk со значением сорта «падеж» - (∃хk:X) Р(xk, t(vk5, vk5));
        11) vi5, vj5 и vk5 должны быть эквивалентны - РЕ(vi5, vj5, vk5).
        Тогда продукция записывается в виде: pr4s =, где
        q4s= (∃хi:X) Рpar(xi, t(vi1, существительное), t(vi5, vi5)) ∧ (∃хj:X) Рpar(xj, t(vj1, существительное),
t(vj5, vj5)) ∧ (∃хt:X) Р(xt, t(vt1, vt1)) ∧ PE(vt1, союз) ∧ Pf(tin(i, t), y2, f2) ∧ РЕ(у2, раньше) ∧ (∃хk:X) Рpar(xk,
t(vk1, существительное), t(vk5, vk5)) ∧ РЕ(vi5, vj5, vk5) ↔ (∃хi:X) (∃xj:X) (∃xk:X) Р2(ОЧС, t(xj, xk, хi));
        r4s = add [P4(ОЧС, t(хi, xj, xk)]; elim [(X, {хj, xk, xt}].
        Правило второе первой ситуации рассматривает четыре лексемы хi, хj, хt и хk, две из которых хi
и хj удовлетворяют фактам 1)-4) первого правила, третья хt удовлетворяет фактам 5)-8), а четвертая
хk не должна удовлетворять факту 9. Тогда продукция для данного правила описывается в виде
двойки: pr5s =, где
        q5s= (∃хi:X) Рpar(xi, t(vi1, существительное), t(vi5, vi5)) ∧ (∃хj:X) Рpar(xj, t(vj1, существительное),
t(vj5, vj5)) ∧ (∃хt:X) Р(xt, t(vt1, vt1)) ∧ PE(vt1, союз) ∧ Pf(tin(i, t), y2, f2) ∧ РЕ(у2, раньше) ∧
P ( x k , t (v k 1 , существительное)) ∧ РЕ(vi5, vj5) ↔ (∃хi:X) (∃xj:X) Р1(ОЧС, t(xj, хi));
     r5s = add [P3(ОЧС, t(хi, xj)]; elim [(X, {хj, xt}].
     Правило третье первой ситуации рассматривает три лексемы хi, хj и хk, а продукция
описывается в виде двойки: pr6s =, где
     q6s= (∃хi:X) Рpar(xi, t(vi1, существительное), t(vi5, vi5)) ∧ (∃хj:X) Рpar(xj, t(vj1, существительное),
t(vj5, vj5)) ∧ P ( x k , t (v k 1 , существительное)) ∧ РЕ(vi5, vj5) ↔ (∃хi:X) (∃xj:X) Р1(ОЧС, t(xj, хi));
      r6s = add [P3(ОЧС, t(хi, xj)]; elim [(X, {хj}].


                                                             97