ВУЗ:
Составители:
Рубрика:
)|1(
1
wdPp
ii
==
, )
то выражение (2.5) можно представить в виде
∏
=
−
−=
D
i
d
i
d
i
ii
ppwdP
1
1
1
1)|(
, (2.6)
где
)|0(1
1
wdPp
ii
==−
.
Аналогично, для нерелевантных документов
∏
=
∏
=
−
=
−=
D
i
d
i
d
i
D
i
i
ii
qqwdPwdP
1
1
1
2
2
1)|()|(
, (2.7)
где
i
q
– вероятность появления термина
i
t
в нерелевантном документе, кото-
рая равна
).|0(1
),|1(
2
2
wdPq
wdPq
ii
ii
==−
==
В вероятностной модели считается, что адекватной мерой релевантности доку-
мента
)(
dR
является отношение
)|(
)|(
)(
2
1
wdP
wdP
dR
=
.
Подставляя в это выражение формулы (2.6) и (2.7), получим
∏
=
−
−
−
=
D
i
d
i
i
d
i
i
ii
q
p
q
p
dR
1
1
1
1
)(
. (2.8)
После логарифмирования и упрощения выражения (2.8) меру релевантности
можно описать следующим образом:
CdWdR
D
i
ii
+=
∑
=
1
)(
, (2.9)
где
.
1
1
1
log
,
)1(
)1(
log
∑
=
−
−
=
−
−
=
D
i
i
i
ii
ii
i
q
p
C
pq
qp
W
В выражении (2.9)
i
W
есть вес термина
i
t
в документе
d
. В данном случае
вес характеризует способность термина отличить релевантный документ от нереле-
26
Страницы
- « первая
- ‹ предыдущая
- …
- 24
- 25
- 26
- 27
- 28
- …
- следующая ›
- последняя »