Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 50 стр.

UptoLike

50
7. Правило для построения словосочетания СЧ (существительное + числительное).
Правило ищет два контактно стоящих слова
х
i
и х
i+1
, где х
i
существительное, а х
i+1
числительное, или, наоборот,
х
i
числительное, а х
i+1
существительное, например,
специальности 220400, 639 группы. В результате формируется словосочетание (х
i
, х
i+1
), где
х
i
существительное и главное слово, х
i+1
числительное и зависимое слово или наоборот.
Остальные правила синтаксического анализа приведены в Приложении Б.
Для разработки продукций синтаксического анализа необходимо определить
множество сортов. Основными сортами синтаксического анализа являются:
·
b
1
сорт, содержащий множество предлогов, разбитых на подмножества предлогов,
употребляемых в определенных падежах, и
b
1
= {предлоги родительного падежа, предлоги
дательного падежа, предлоги винительного падежа, предлоги творительного падежа,
предлоги предложного падежа} = {
b
11
, b
12
,
b
13
,
b
14
,
b
15
};
·
b
2
сорт, содержащий множество предлогов, разбитых по обстоятельственным
значениям существительного, и
b
2
= {предлоги места, предлоги времени, предлоги
количества или меры, предлоги назначения, предлоги источника или происхождения,
предлоги условия, предлоги сферы действия или состояния, предлоги совместности или
несовместности} = {
b
21
, b
22
, b
23
, b
24
, b
25
,
b
26
, b
27
, b
28
}.
Кроме сортов синтаксического анализа будем использовать сорта морфологического
анализа
s
742
, s
741
, s
74
, s
73
, s
72
, s
71
, s
70
, s
9
, s
8
.
2.4.2. База правил синтаксического анализа
Базу правил синтаксического анализа будем строить в виде системы продукций,
состоящей из трех подсистем:
1) подсистема правил нахождения синтаксических групп;
2) подсистема правил нахождения связи между парой лексем. Эти правила
основываются на морфологических характеристиках словоформ;
3) подсистема правил формирования связи между синтаксической группой и
лексемой. Эта категория правил предназначена для выявления связи между лексемами
определенной синтаксической группы и отдельной лексемой множества Х в случае, когда
нельзя применить правила второй категории (например,
электротехнический и
экономический факультеты
).
Каждое правило представляет собой возможную ситуацию, которую можно описать в
виде конъюнкции множества фактов и представить в виде продукции
pr
S
=<q
S
,r
S
>. Условие
применимости, построенное в предикатном представлении, описывает ситуацию, при
которой может активизироваться программа. Программа
r
S
продукции pr
S
представляется в
виде операций добавления и удаления. Операция добавления в
r
S
позволяет формировать
множество дуг
D, множество главных лексем L
1
и множество зависимых лексем L
2
, а также
множество синтаксических групп
L
.
Операция удаления предназначена для нормализации
исходного списка лексем
Х.
Поэтому рассмотрим последовательность формирования продукционных правил на
примере одного правила для каждой подсистемы. В полном объеме система продукций
синтаксического анализа приведена в Приложении Б.
1 подсистема правил. Нахождение синтаксических групп на примере построения
правила формирования группы ПС (предлог и существительное): пара лексем
х
i
и х
j
образуют синтаксическую группу ПС тогда и только тогда, когда имеет место
      7. Правило для построения словосочетания СЧ (существительное + числительное).
Правило ищет два контактно стоящих слова хi и хi+1, где хi – существительное, а хi+1 –
числительное, или, наоборот, хi – числительное, а хi+1 – существительное, например,
специальности 220400, 639 группы. В результате формируется словосочетание (хi, хi+1), где
хi –существительное и главное слово, хi+1 – числительное и зависимое слово или наоборот.
      Остальные правила синтаксического анализа приведены в Приложении Б.
      Для разработки продукций синтаксического анализа необходимо определить
множество сортов. Основными сортами синтаксического анализа являются:
      · b1 – сорт, содержащий множество предлогов, разбитых на подмножества предлогов,
употребляемых в определенных падежах, и b1 = {предлоги родительного падежа, предлоги
дательного падежа, предлоги винительного падежа, предлоги творительного падежа,
предлоги предложного падежа} = {b11, b12, b13, b14, b15};
      · b2 – сорт, содержащий множество предлогов, разбитых по обстоятельственным
значениям существительного, и b2 = {предлоги места, предлоги времени, предлоги
количества или меры, предлоги назначения, предлоги источника или происхождения,
предлоги условия, предлоги сферы действия или состояния, предлоги совместности или
несовместности} = {b21, b22, b23, b24, b25, b26, b27, b28}.
      Кроме сортов синтаксического анализа будем использовать сорта морфологического
анализа s742, s741, s74, s73, s72, s71, s70, s9, s8.
2.4.2. База правил синтаксического анализа
     Базу правил синтаксического анализа будем строить в виде системы продукций,
состоящей из трех подсистем:
     1) подсистема правил нахождения синтаксических групп;
     2) подсистема правил нахождения связи между парой лексем. Эти правила
основываются на морфологических характеристиках словоформ;
     3) подсистема правил формирования связи между синтаксической группой и
лексемой. Эта категория правил предназначена для выявления связи между лексемами
определенной синтаксической группы и отдельной лексемой множества Х в случае, когда
нельзя применить правила второй категории (например,          электротехнический и
экономический факультеты).
     Каждое правило представляет собой возможную ситуацию, которую можно описать в
виде конъюнкции множества фактов и представить в виде продукции prS=. Условие
применимости, построенное в предикатном представлении, описывает ситуацию, при
которой может активизироваться программа. Программа rS продукции prS представляется в
виде операций добавления и удаления. Операция добавления в rS позволяет формировать
множество дуг D, множество главных лексем L1 и множество зависимых лексем L2, а также
множество синтаксических групп L. Операция удаления предназначена для нормализации
исходного списка лексем Х.
     Поэтому рассмотрим последовательность формирования продукционных правил на
примере одного правила для каждой подсистемы. В полном объеме система продукций
синтаксического анализа приведена в Приложении Б.
     1 подсистема правил. Нахождение синтаксических групп на примере построения
правила формирования группы ПС (предлог и существительное): пара лексем хi и хj
образуют синтаксическую группу ПС тогда и только тогда, когда имеет место
                                           50