Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 37 стр.

UptoLike

37
высказывание представляется в виде соответствующего предиката, а на последнем
строится формула для условия применимости
q продукции. Программа r продукции pr
представляется в виде операций добавления и/или удаления фактов.
База правил морфологического анализа включает в себя продукционные правила по
распознаванию ситуаций, связанных с идентификацией слов, относящихся к неизменяемым
и изменяемым частям речи. Входная информация представляется в виде результатов
предварительного лексического анализа, т.е. на вход системе продукций подается лексема
х
i
Х, где Хмножество лексем естественно-языкового запроса.
Таким образом, рассмотрим возможные ситуации, возникающие при проведении
морфологического анализа, описанные в виде продукционных правил в три этапа.
Правило рr
1
М
касается ситуации, описывающей принадлежность лексемы к
неизменяемой части речи:
х
i
лексема относится к неизменяемым частям речи тогда и
только тогда, когда имеет место ситуация, представляющая собой конъюнкцию следующих
фактов:
1) лексема
х
i
принадлежит сорту s
i
S;
2) сорт
s
i
имеет значение s
32
(множество неизменяемых слов);
3) лексема
х
i
отображается во флективный класс y
1
;
4) флективный класс
y
1
принадлежит сорту s
2j
s
2
;
5) сорт
s
2j
имеет значение s
25
(множество флективных классов неизменяемых слов);
6) флективный класс
s
2j
отображается в набор морфологической информации y
2
;
7) набор морфологической информации
y
2
принадлежит сорту s
74k
(множество
неизменяемых частей речи);
8) сорт
s
74k
имеет значение s
742
(множество частей речи неизменяемых слов).
Утверждениям данной ситуации соответствуют следующие предикаты:
- основному утверждению «существует лексема
х
i
Х, которая находится в
отношении квалификации с сортом
s
32
» соответствует предикат - (х
i
:X) P
s
(х
i
, s
32
,
r
t
2
);
- фактам соответствует следующий набор предикатов:
1)
P
f
(t
in
(x
i
), y
1
, f
1
);
2)
P
E
(y
1
, s
32
);
3)
P
f
(t
in
(x
i
, Н
1
(u, v)), y
2
, f
4
);
4)
P
f
(t
in
(y
2
), y
3
, f
1
);
5)
P
E
(y
3
, s
25
);
6)
P
f
(t
in
(y
4
, Н
2
(u, v)), y
4
, f
4
);
7)
P
f
(t
in
(y
4
), y
5
, f
1
);
8)
P
E
(y
5
, s
742
).
Таким образом, элементы продукции
pr
1
М
имеют следующий вид:
q
1
М
= P
f
(t
in
(x
i
), y
1
, f
1
) P
E
(y
1
, s
32
) P
f
(t
in
(x
i
, Н
1
(u, v)), y
2
, f
4
) P
f
(t
in
(y
2
), y
3
, f
1
) P
E
(y
3
, s
25
)
P
f
(t
in
(y
4
, Н
2
(u, v)), y
4
, f
4
) P
f
(t
in
(y
4
), y
5
, f
1
) P
E
(y
5
, s
742
) (х
i
:X) P
s
(х
i
, s
32
,
r
t
2
);
r
1
М
= add [v
i1
, y
5
].
Программа
r
1
М
присваивает элементу v
i1
вектора V
i
V название полученной части
речи.
При описании следующих правил совместим содержательное и формальное описание
утверждений.
высказывание представляется в виде соответствующего предиката, а на последнем –
строится формула для условия применимости q продукции. Программа r продукции pr
представляется в виде операций добавления и/или удаления фактов.
      База правил морфологического анализа включает в себя продукционные правила по
распознаванию ситуаций, связанных с идентификацией слов, относящихся к неизменяемым
и изменяемым частям речи. Входная информация представляется в виде результатов
предварительного лексического анализа, т.е. на вход системе продукций подается лексема
хi∈Х, где Х – множество лексем естественно-языкового запроса.
      Таким образом, рассмотрим возможные ситуации, возникающие при проведении
морфологического анализа, описанные в виде продукционных правил в три этапа.
      Правило рr1М касается ситуации, описывающей принадлежность лексемы к
неизменяемой части речи: хi лексема относится к неизменяемым частям речи тогда и
только тогда, когда имеет место ситуация, представляющая собой конъюнкцию следующих
фактов:
      1) лексема хi принадлежит сорту si∈S;
      2) сорт si имеет значение s32 (множество неизменяемых слов);
      3) лексема хi отображается во флективный класс y1;
      4) флективный класс y1 принадлежит сорту s2j ∈s2;
      5) сорт s2j имеет значение s25 (множество флективных классов неизменяемых слов);
      6) флективный класс s2j отображается в набор морфологической информации y2;
      7) набор морфологической информации y2 принадлежит сорту s74k (множество
неизменяемых частей речи);
      8) сорт s74k имеет значение s742 (множество частей речи неизменяемых слов).
      Утверждениям данной ситуации соответствуют следующие предикаты:
      - основному утверждению «существует лексема хi∈Х, которая находится в
отношении квалификации с сортом s32» соответствует предикат - (∃хi:X) Ps(хi, s32, t 2r );
        -   фактам соответствует следующий набор предикатов:
            1) Pf(tin(xi), y1, f1);
            2) PE(y1, s32);
            3) Pf(tin(xi, Н1(u, v)), y2, f4);
            4) Pf(tin(y2), y3, f1);
            5) PE(y3, s25);
            6) Pf(tin(y4, Н2(u, v)), y4, f4);
            7) Pf(tin(y4), y5, f1);
            8) PE(y5, s742).
        Таким образом, элементы продукции pr1М имеют следующий вид:
        q1 М = Pf(tin(xi), y1, f1) ∧ PE(y1, s32) ∧ Pf(tin(xi, Н1(u, v)), y2, f4) ∧ Pf(tin(y2), y3, f1) ∧ PE(y3, s25)
∧ Pf(tin(y4, Н2(u, v)), y4, f4) ∧ Pf(tin(y4), y5, f1) ∧ PE(y5, s742) ↔ (∃хi:X) Ps(хi, s32, t 2r );
        r1 М = add [vi1, y5].
        Программа r1 М присваивает элементу vi1 вектора Vi∈V название полученной части
речи.
     При описании следующих правил совместим содержательное и формальное описание
утверждений.

                                                         37