Введение в информационно-поисковые системы. Иванов В.К - 26 стр.

UptoLike

Составители: 

)|1(
1
wdPp
ii
==
, )
то выражение (2.5) можно представить в виде
=
=
D
i
d
i
d
i
ii
ppwdP
1
1
1
1)|(
, (2.6)
где
)|0(1
1
wdPp
ii
==
.
Аналогично, для нерелевантных документов
=
=
=
=
D
i
d
i
d
i
D
i
i
ii
qqwdPwdP
1
1
1
2
2
1)|()|(
, (2.7)
где
i
q
вероятность появления термина
i
t
в нерелевантном документе, кото-
рая равна
).|0(1
),|1(
2
2
wdPq
wdPq
ii
ii
==
==
В вероятностной модели считается, что адекватной мерой релевантности доку-
мента
)(
dR
является отношение
.
Подставляя в это выражение формулы (2.6) и (2.7), получим
=
=
D
i
d
i
i
d
i
i
ii
q
p
q
p
dR
1
1
1
1
)(
. (2.8)
После логарифмирования и упрощения выражения (2.8) меру релевантности
можно описать следующим образом:
CdWdR
D
i
ii
+=
=
1
)(
, (2.9)
где
.
1
1
1
log
,
)1(
)1(
log
=
=
=
D
i
i
i
ii
ii
i
q
p
C
pq
qp
W
В выражении (2.9)
i
W
есть вес термина
i
t
в документе
d
. В данном случае
вес характеризует способность термина отличить релевантный документ от нереле-
26