ВУЗ:
Составители:
Рубрика:
1.
v
k
=l (все термины равнозначны);
2.
v
k
=log[r
k
n
0
/(D
k
R
0
)];
3.
v
k
=log(r
k
/D
k
);
4. v
k
= log
.
Термин будет особенно важным, если он встречается
во многих или в большинстве найденных докумен-
тов, отмеченных как релевантные, и только в неболь-
шом числе нерелевантных документов.
При осуществлении третьей операции индексиро-
вания (соотнесения терминов с тем или иным клас-
сом) можно использовать матрицу ассоциируемости
терминов, задающую для каждой пары терминов
соответствующий показатель ассоциируемости. Если
он превосходит по величине некоторый заранее за-
данный порог, можно считать соответствующие тер-
мины имеющими достаточно высокую степень ассо-
циируемости, объединить их в один класс и в тех
случаях, когда в ПП имеется один из рассматриваемых
терминов, автоматически добавлять в него другой.
Наиболее употребительным является следующий
коэффициент ассоциируемости:
Легко видеть, что 0≤ f(j, k)≤ 1 для любых терминов j и k.
Приведем пример матрицы ассоциируемости для
четырех терминов А, В, С, D. По построению она должна
быть симметрична относительно главной диагонали,
которая всегда состоит из единиц. Пусть дано ПП в
виде вектора q = (4, 2, 1, 1). В результате применения
матрицы ассоциируемости первоначальные веса
терминов А, В, С, D (т. е. 4, 2, 1, 1) переходят в веса 5
1
/
4
,
4
3
/
4
, 2
3
/
4
, 2
1
/
4
:
183
1. vk=l (все термины равнозначны);
2. vk=log[r k n 0 /(D k R 0 )];
3. vk=log(rk/Dk);
4. vk = log
.
Термин будет особенно важным, если он встречается
во многих или в большинстве найденных докумен-
тов, отмеченных как релевантные, и только в неболь-
шом числе нерелевантных документов.
При осуществлении третьей операции индексиро-
вания (соотнесения терминов с тем или иным клас-
сом) можно использовать матрицу ассоциируемости
терминов, задающую для каждой пары терминов
соответствующий показатель ассоциируемости. Если
он превосходит по величине некоторый заранее за-
данный порог, можно считать соответствующие тер-
мины имеющими достаточно высокую степень ассо-
циируемости, объединить их в один класс и в тех
случаях, когда в ПП имеется один из рассматриваемых
терминов, автоматически добавлять в него другой.
Наиболее употребительным является следующий
коэффициент ассоциируемости:
Легко видеть, что 0≤ f(j, k)≤ 1 для любых терминов j и k.
Приведем пример матрицы ассоциируемости для
четырех терминов А, В, С, D. По построению она должна
быть симметрична относительно главной диагонали,
которая всегда состоит из единиц. Пусть дано ПП в
виде вектора q = (4, 2, 1, 1). В результате применения
матрицы ассоциируемости первоначальные веса
терминов А, В, С, D (т. е. 4, 2, 1, 1) переходят в веса 51/4,
43/4, 23/4, 21/4:
183
Страницы
- « первая
- ‹ предыдущая
- …
- 181
- 182
- 183
- 184
- 185
- …
- следующая ›
- последняя »
