ВУЗ:
Составители:
Рубрика:
312
0
N
Документная
частота DF
Низкая DF Средняя DF Высокая DF
Нулевые
значения DV
Положительные
значения DV
Отрицательные
значения DV
Улучшение полноты
Улучшение точности
Рис. 8. Характеристика терминов по распределению документной частоты
На рис. Рис. 9 изображено несколько типичных распределений частот терми-
нов. Наилучшими для индексации являются термины, имеющие распределение
(рис. Рис. 9 а). Они обеспечивают приемлемые значения полноты и точности поиска.
Термины с распределениями (рис. Рис. 9 б) повышают точность, но резко снижают
полноту поиска, а с распределениями (рис. Рис. 9 в) – наоборот, увеличивают полно-
ту, но уменьшают точность. Наконец, равномерное распределение частоты
(рис. Рис. 9 г) свойственно общеупотребительным терминам, которые не обеспечи-
вают ни надлежащей точности поиска, ни его полноты.
0
i
TF
)(
Документы
0
i
TF
)(
Документы
а б
0
i
TF
)(
Документы
0
i
TF
)(
Документы
в г
Рис. 9. Распределения частот терминов в документах
22
Страницы
- « первая
- ‹ предыдущая
- …
- 20
- 21
- 22
- 23
- 24
- …
- следующая ›
- последняя »