ВУЗ:
Составители:
Рубрика:
а 0 = 0, а 1 = 1, 0 1 = 1, а а = а.
Характерной функцией совпадения является f = = (А -
В)/(А + В) + (А' — B')/(A' + В') где A и B -число
совпадений и несовпадений терминов, А' и B' —
число совпадений и несовпадений классов.
Заметим, что при описанной процедуре особую
роль играют общие термины в сравниваемых векторах-
Очевидно, что они приписываются к совпадениям
терминов. Если же общий термин содержится и в
некотором классе С, происходит дополнительное сов-
падение классов. Поэтому общие термины приобре-
тают чрезмерный вес. Чтобы избежать этого ослож-
нения, обычно перед вычислением совпадений и
несовпадений классов из рассмотрения исключают
все общие термины.
Сформулируем, используя теоретико-множествен-
ные операции, процедуру сопоставления новых доку-
ментов R с документами фонда D на основании их
векторов терминов и классов.
1. Находим D∩R, D\R, R\D.
2. Вычисляем число А совпадений терминов из
D∩R и число В несовпадений терминов из
D\R
и
R\D.
3.
Строим вектор класса для
D\R
и
R\D
(обоз-
начения (D\R)
C
и (R\D)
C
).
4. Вычисляем числа А' и B' совпадений и несов-
падений (D\R)
C
и (R\D)
C
.
5. Вычисляем значения функции f и, сравнивая
его с пороговым значением, выносим решение
о включении документа в фонд.
Пример, Даны матрица,
состоящая из векторов клас-
са данного набора терминов
Т
1
, Т
2
, ..., Т
8
, документ
фонда D = (0, 0, 0, 0, 1, 1, 1, 1),
новый документ R = (0, 1, 1,
0, 0, 1, 1, 0) и пороговое зна-
чение |f(D, R)| ≥,0, 1. Имеем
D\R = (0, 0, 0, 0, 1, 0, 0, 1),
R\D = (0, 1, 1, 0, 0, 0, 0, 0),
D∩R = (0, 0, 0, 0, 0,1, 1, 0),
A = 2, В = 4;
203
Таблица 36
. Классы
Термины
с
5
С
4
C
1
C
3
С
2
1
0
a
a
0
1
0
a
1
a
a
a
0
1
1
1
a
0
0
a
a
0
1
a
0
1
a
0
a
1
a
a
a
0
1
1
1
0
0
0
а 0 = 0, а 1 = 1, 0 1 = 1, а а = а.
Характерной функцией совпадения является f = = (А -
В)/(А + В) + (А' — B')/(A' + В') где A и B -число
совпадений и несовпадений терминов, А' и B' —
число совпадений и несовпадений классов.
Заметим, что при описанной процедуре особую
роль играют общие термины в сравниваемых векторах-
Очевидно, что они приписываются к совпадениям
терминов. Если же общий термин содержится и в
некотором классе С, происходит дополнительное сов-
падение классов. Поэтому общие термины приобре-
тают чрезмерный вес. Чтобы избежать этого ослож-
нения, обычно перед вычислением совпадений и
несовпадений классов из рассмотрения исключают
все общие термины.
Сформулируем, используя теоретико-множествен-
ные операции, процедуру сопоставления новых доку-
ментов R с документами фонда D на основании их
векторов терминов и классов.
1. Н а х о д и м D ∩ R , D \ R , R \ D .
2. Вычисляем число А совпадений терминов из
D∩R и число В несовпадений терминов из
D\R и R\D.
3. Строим вектор класса для D\R и R\D (обоз-
начения (D\R) C и (R\D) C ).
4. Вычисляем числа А' и B' совпадений и несов-
падений (D\R) C и (R\D) C .
5. Вычисляем значения функции f и, сравнивая
его с пороговым значением, выносим решение
о включении документа в фонд.
Пример, Даны матрица,
состоящая из векторов клас- Таблица 36
са данного набора терминов
Т1, Т 2 , ..., Т 8 , документ . Классы
Термины
фонда D = (0, 0, 0, 0, 1, 1, 1, 1), C1 С2 C3 С4 с5
новый документ R = (0, 1, 1,
0, 0, 1, 1, 0) и пороговое зна- 1 1 a 0 a
чение |f(D, R)| ≥,0, 1. Имеем a 0 0 1 0
a a 0 a 1
D\R = (0, 0, 0, 0, 1, 0, 0, 1), a a a 0 1
0 0 a a 1
R\D = (0, 1, 1, 0, 0, 0, 0, 0), 1 1 0 1 0
1 0 1 a 0
D∩R = (0, 0, 0, 0, 0,1, 1, 0), 1 a a a 0
A = 2, В = 4;
203
Страницы
- « первая
- ‹ предыдущая
- …
- 201
- 202
- 203
- 204
- 205
- …
- следующая ›
- последняя »
