ВУЗ:
Составители:
Рубрика:
алгоритмическую релевантность, в отличие от остальных видов релевантности, мож-
но рассчитать без участия пользователя. Обычно она определяется самой поиско-
вой системой в ходе работы поискового алгоритма.
Теоретически релевантность можно измерить некоторым числом в интервале
от нуля (полностью непертинентный документ) до единицы (полностью пертинент-
ный документ). На практике же релевантность в основном определяется при оценке
просматриваемых документов – подходит ли данный документ пользователю или не
подходит. Таким образом, релевантность обычно характеризуется бинарным значе-
нием [, , ].
Существуют также методы оценки релевантности по многозначной шкале. В
этом случае коллектив экспертов просматривает доступные документы и присваива-
ет каждому из них некоторое значение релевантности, которое определяется для
каждого запроса. Такая методика используется главным образом при сравнении эф-
фективности нескольких поисковых систем.
Один и тот же документ может быть релевантным согласно одному определе-
нию релевантности и нерелевантным согласно другому. Так, документ, релевантный
алгоритмически, может оказаться непертинентным. Например, если в неспециализи-
рованной ИПС искать информацию о компьютерных манипуляторах типа "мышь" и
использовать для этого запрос, состоящий из слова "мышь", то велика вероятность
получения ряда непертинентных документов из области зоологии и географии, опи-
сывающих мышей-грызунов. При этом найденные непертинентные документы фор-
мально будут соответствовать запросу, так как в их тексте содержится термин запро-
са – "мышь".
Релевантность не является статичной величиной и может со временем менять-
ся. Например, знания пользователя могут измениться после прочтения найденного
документа, что в свою очередь может привести к составлению нового запроса, то
есть к изменению формализованной информационной потребности. Это иллюстри-
рует интерактивную природу информационного поиска [, ].
Различные определения релевантности весьма затрудняют оценку эффектив-
ности поиска информации. Качество поиска в информационно-поисковых системах
обычно характеризуется двумя критериями – полнотой и точностью. Полнота поиска
определяется общим количеством найденных документов, а точность – соотношени-
ем между найденными релевантными и нерелевантными документами. Из-за много-
значности определения релевантности абсолютного критерия точности поиска не су-
ществует, и в результатах любого поиска всегда присутствуют как релевантные, так
и нерелевантные документы.
10
Страницы
- « первая
- ‹ предыдущая
- …
- 8
- 9
- 10
- 11
- 12
- …
- следующая ›
- последняя »