Математические методы в библиотечной работе. Елизаров А.М - 183 стр.

UptoLike

Составители: 

Рубрика: 

1.
v
k
=l (все термины равнозначны);
2.
v
k
=log[r
k
n
0
/(D
k
R
0
)];
3.
v
k
=log(r
k
/D
k
);
4. v
k
= log
.
Термин будет особенно важным, если он встречается
во многих или в большинстве найденных докумен-
тов, отмеченных как релевантные, и только в неболь-
шом числе нерелевантных документов.
При осуществлении третьей операции индексиро-
вания (соотнесения терминов с тем или иным клас-
сом) можно использовать матрицу ассоциируемости
терминов, задающую для каждой пары терминов
соответствующий показатель ассоциируемости. Если
он превосходит по величине некоторый заранее за-
данный порог, можно считать соответствующие тер-
мины имеющими достаточно высокую степень ассо-
циируемости, объединить их в один класс и в тех
случаях, когда в ПП имеется один из рассматриваемых
терминов, автоматически добавлять в него другой.
Наиболее употребительным является следующий
коэффициент ассоциируемости:
Легко видеть, что 0 f(j, k) 1 для любых терминов j и k.
Приведем пример матрицы ассоциируемости для
четырех терминов А, В, С, D. По построению она должна
быть симметрична относительно главной диагонали,
которая всегда состоит из единиц. Пусть дано ПП в
виде вектора q = (4, 2, 1, 1). В результате применения
матрицы ассоциируемости первоначальные веса
терминов А, В, С, D (т. е. 4, 2, 1, 1) переходят в веса 5
1
/
4
,
4
3
/
4
, 2
3
/
4
, 2
1
/
4
:
183
   1. vk=l (все термины равнозначны);
   2. vk=log[r k n 0 /(D k R 0 )];
   3. vk=log(rk/Dk);
   4. vk = log
                             .
Термин будет особенно важным, если он встречается
во многих или в большинстве найденных докумен-
тов, отмеченных как релевантные, и только в неболь-
шом числе нерелевантных документов.
   При осуществлении третьей операции индексиро-
вания (соотнесения терминов с тем или иным клас-
сом) можно использовать матрицу ассоциируемости
терминов, задающую для каждой пары терминов
соответствующий показатель ассоциируемости. Если
он превосходит по величине некоторый заранее за-
данный порог, можно считать соответствующие тер-
мины имеющими достаточно высокую степень ассо-
циируемости, объединить их в один класс и в тех
случаях, когда в ПП имеется один из рассматриваемых
терминов, автоматически добавлять в него другой.
Наиболее употребительным является следующий
коэффициент ассоциируемости:




Легко видеть, что 0≤ f(j, k)≤ 1 для любых терминов j и k.
Приведем пример матрицы ассоциируемости для
четырех терминов А, В, С, D. По построению она должна
быть симметрична относительно главной диагонали,
которая всегда состоит из единиц. Пусть дано ПП в
виде вектора q = (4, 2, 1, 1). В результате применения
матрицы ассоциируемости первоначальные веса
терминов А, В, С, D (т. е. 4, 2, 1, 1) переходят в веса 51/4,
43/4, 23/4, 21/4:




                                                          183