Введение в информационно-поисковые системы - 10 стр.

UptoLike

Составители: 

ki
OL
,
величина, характеризующая наличие гиперссылки из
i
P
в
k
P
(исхо-
дящей гиперссылки).
0
,
=
ki
OL
, если ссылки нет,
1
,
=
ki
OL
, если она есть.
1.2.1. Алгоритм расширенного булевого поиска
Алгоритм расширенного булевого поиска основан на булевой модели, причем
расширением является возможность ранжировать найденные документы по числу
терминов запроса, которые в них встречаются. Такую модель поиска можно рассмат-
ривать как упрощенную модель поиска в нечетких множествах [] в противополож-
ность строгим множествам булевого поиска.
Релевантность документа
i
P
по отношению к запросу
q
рассчитывается как
=
=
M
j
ji
qi
CR
1
,
,
. (1.2)
Алгоритм расширенного булевого поиска использует модель (1.2) не только для
данного документа, но и для соседних с ним, учитывая частоту появления в них слов
запроса. Такое становится возможным в среде гипертекстовых документов. Предпо-
лагается, что если два документа связаны гиперссылкой, то между ними должна су-
ществовать и некоторая семантическая (смысловая) связь.
Практически это выглядит следующим образом. Если документ
i
P
не содержит
термина запроса
j
Q
, но связан с другими документом
, в который этот термин
входит, то полагают, что документ
i
P
содержит термин
j
Q
. Однако при этом во
время ранжирования документу
i
P
приписывается меньший вес, чем если бы он на
самом деле содержал термин
j
Q
. Алгоритм определения релевантности документа
i
P
и запроса
q
принимает вид
=
=
M
j
ji
qi
IR
1
,
,
,
где
ji
I
,
определяется следующим образом:
>+=
=
=
.,
,,,
,
2
,
,
1
,
0
,0)(1
,1
случаяхдругихвсехво
kiki
и
jk
что,такоесуществуетесли
ji
если
ji
OLILСkc
Сc
I
8