Методы и алгоритмы трансляции естественно-языковых запросов к базе данных в SQL-запросы. Найханова Л.В - 35 стр.

UptoLike

35
s
32
- словарь неизменяемых слов и s
32
={х
321
,
х
322
,
х
323
, …, х
32k
}, где kколичество
неизменяемых слов;
s
33
- словарь имен собственных и s
33
={х
331
,
х
332
,
х
333
, …, х
33f
}, где f количество имен
собственных.
s
8
сорт, содержащий множество морфологических признаков числа словоформы и
s
8
={единственное, множественное}={х
81,
х
82
};
s
9
сорт, содержащий множество морфологических признаков падежа словоформы и
s
9
={именительный, родительный, дательный, винительный, творительный,
предложный}={
х
91,
х
92
, х
93
, х
94
, х
95
, х
96
};
s
70
сорт, содержащий множество морфологических признаков рода словоформы и
s
70
={ мужской, женский, средний}={х
701,
х
702
, х
703
};
s
71
сорт, содержащий множество морфологических признаков одушевленности
словоформы и
s
71
={одушевленный, неодушевленный}={х
711,
х
712
};
s
72
сорт, содержащий множество морфологических признаков лица словоформы и
s
72
={первое, второе, третье}={х
721,
х
722
, х
723
};
s
73
сорт, содержащий множество морфологических признаков времени глаголов и
s
73
={настоящее, прошедшее, будущее}={х
731,
х
732
, х
733
};
s
74
сорт, содержащий множество частей речи и s
74
={s
741
, s
742
}, где
s
741
множество изменяемых частей речи и s
741
={существительное, прилагательное,
глагол, краткое прилагательное, глагол в прошедшем времени}={
х
7411,
х
7412,
х
7413
, х
7414
,
х
7415
};
s
742
множество неизменяемых частей речи и s
75
={наречия, предлоги, союзы,
числительное, частицы, неизменяемые существительные, неизменяемые прилагательные,
неизменяемые глаголы, инфинитив, сравнительная степень прилагательного, вводные
слова, междометия, деепричастия, цифры}={
х
7421,
х
7422,
х
7423, …,
х
74212
};
s
75
сорт, содержащий множество наборов переменной морфологической
информации и
s
75
={s
751
, s
752
, s
753
, s
754
}, где s
751
={< s
71
, s
70
, s
8
, s
9
, s
72
>, …} – множество
наборов морфологической информации существительных;
s
752
- множество наборов
морфологической информации прилагательных;
s
753
- множество наборов морфологической
информации глаголов; s
754
- множество наборов морфологической информации
неизменяемых частей речи.
Морфологическая информация (МИ) должна быть представлена в виде вектора
V =
<
v
1
, v
2
, v
3
, v
4
, v
5
, v
6
, v
7
, v
8
>, где v
1
часть речи, v
2
признак одушевленности, v
3
род, v
4
число
, v
5
падеж, v
6
лицо, v
7
время, v
8
признак для имени собственного. Тогда х
i
лексеме в результате морфологического анализа будет приписан V
i
= <v
i1
, v
i2
, v
i3
, v
i4
, v
i5
, v
i6
,
v
i7
, v
i8
> вектор морфологической информации. При этом v
i1
соответствует значение
постоянной МИ, а элементам
v
i2
, v
i3
, v
i4
, v
i5
, v
i6
, v
i7
, v
8
переменные характеристики
морфологической информации.
2.3.2.2. Типовые предикаты условий применимости продукций морфологического
анализа
Для описания морфологического анализа в работе использованы предикаты
функционального типа (табл. 6), имеющие тернарный кортеж термов. Первый терм
описывает входную информацию, второйвыходную и третийссылку на
      s32 - словарь неизменяемых слов и s32={х321, х322, х323, …, х32k}, где k – количество
неизменяемых слов;
      s33 - словарь имен собственных и s33={х331, х332, х333, …, х33f}, где f – количество имен
собственных.
      s8 – сорт, содержащий множество морфологических признаков числа словоформы и
s8={единственное, множественное}={х81, х82};
      s9 – сорт, содержащий множество морфологических признаков падежа словоформы и
s9={именительный,             родительный,       дательный,      винительный,     творительный,
предложный}={х91, х92, х93, х94, х95, х96};
      s70 – сорт, содержащий множество морфологических признаков рода словоформы и
s70={ мужской, женский, средний}={х701, х702, х703};
      s71 – сорт, содержащий множество морфологических признаков одушевленности
словоформы и s71={одушевленный, неодушевленный}={х711, х712};
      s72 – сорт, содержащий множество морфологических признаков лица словоформы и
s72={первое, второе, третье}={х721, х722, х723};
      s73 – сорт, содержащий множество морфологических признаков времени глаголов и
s73={настоящее, прошедшее, будущее}={х731, х732, х733};
      s74 – сорт, содержащий множество частей речи и s74={s741, s742}, где
      s741 – множество изменяемых частей речи и s741={существительное, прилагательное,
глагол, краткое прилагательное, глагол в прошедшем времени}={х7411, х7412, х7413, х7414,
х7415};
      s742 –множество неизменяемых частей речи и s75={наречия, предлоги, союзы,
числительное, частицы, неизменяемые существительные, неизменяемые прилагательные,
неизменяемые глаголы, инфинитив, сравнительная степень прилагательного, вводные
слова, междометия, деепричастия, цифры}={х7421, х7422, х7423, …, х74212};
      s75 – сорт, содержащий множество наборов переменной морфологической
информации и s75={s751, s752, s753, s754}, где s751={< s71, s70, s8, s9, s72>, …} – множество
наборов морфологической информации существительных; s752 - множество наборов
морфологической информации прилагательных; s753 - множество наборов морфологической
информации глаголов; s754 - множество наборов морфологической информации
неизменяемых частей речи.
      Морфологическая информация (МИ) должна быть представлена в виде вектора V =
, где v1 – часть речи, v2 – признак одушевленности, v3 – род, v4 –
число, v5 – падеж, v6 – лицо, v7 – время, v8 – признак для имени собственного. Тогда хi
лексеме в результате морфологического анализа будет приписан Vi =  вектор морфологической информации. При этом vi1 соответствует значение
постоянной МИ, а элементам vi2, vi3, vi4, vi5, vi6, vi7, v8 – переменные характеристики
морфологической информации.

2.3.2.2. Типовые предикаты условий применимости продукций морфологического
анализа
     Для описания морфологического анализа в работе использованы предикаты
функционального типа (табл. 6), имеющие тернарный кортеж термов. Первый терм
описывает входную информацию, второй – выходную и третий – ссылку на

                                               35