Математические методы в библиотечной работе. Елизаров А.М - 203 стр.

UptoLike

Составители: 

Рубрика: 

а 0 = 0, а 1 = 1, 0 1 = 1, а а = а.
Характерной функцией совпадения является f = = (А -
В)/(А + В) + (А' — B')/(A' + В') где A и B -число
совпадений и несовпадений терминов, А' и B'
число совпадений и несовпадений классов.
Заметим, что при описанной процедуре особую
роль играют общие термины в сравниваемых векторах-
Очевидно, что они приписываются к совпадениям
терминов. Если же общий термин содержится и в
некотором классе С, происходит дополнительное сов-
падение классов. Поэтому общие термины приобре-
тают чрезмерный вес. Чтобы избежать этого ослож-
нения, обычно перед вычислением совпадений и
несовпадений классов из рассмотрения исключают
все общие термины.
Сформулируем, используя теоретико-множествен-
ные операции, процедуру сопоставления новых доку-
ментов R с документами фонда D на основании их
векторов терминов и классов.
1. Находим DR, D\R, R\D.
2. Вычисляем число А совпадений терминов из
DR и число В несовпадений терминов из
D\R
и
R\D.
3.
Строим вектор класса для
D\R
и
R\D
(обоз-
начения (D\R)
C
и (R\D)
C
).
4. Вычисляем числа А' и B' совпадений и несов-
падений (D\R)
C
и (R\D)
C
.
5. Вычисляем значения функции f и, сравнивая
его с пороговым значением, выносим решение
о включении документа в фонд.
Пример, Даны матрица,
состоящая из векторов клас-
са данного набора терминов
Т
1
, Т
2
, ..., Т
8
, документ
фонда D = (0, 0, 0, 0, 1, 1, 1, 1),
новый документ R = (0, 1, 1,
0, 0, 1, 1, 0) и пороговое зна-
чение |f(D, R)| ,0, 1. Имеем
D\R = (0, 0, 0, 0, 1, 0, 0, 1),
R\D = (0, 1, 1, 0, 0, 0, 0, 0),
DR = (0, 0, 0, 0, 0,1, 1, 0),
A = 2, В = 4;
203
Таблица 36
. Классы
Термины
с
5
С
4
C
1
C
3
С
2
1
0
a
a
0
1
0
a
1
a
a
a
0
1
1
1
a
0
0
a
a
0
1
a
0
1
a
0
a
1
a
a
a
0
1
1
1
0
0
0
            а 0 = 0, а 1 = 1, 0 1 = 1, а а = а.
Характерной функцией совпадения является f = = (А -
В)/(А + В) + (А' — B')/(A' + В') где A и B -число
совпадений и несовпадений терминов, А' и B' —
число совпадений и несовпадений классов.
    Заметим, что при описанной процедуре особую
роль играют общие термины в сравниваемых векторах-
Очевидно, что они приписываются к совпадениям
терминов. Если же общий термин содержится и в
некотором классе С, происходит дополнительное сов-
падение классов. Поэтому общие термины приобре-
тают чрезмерный вес. Чтобы избежать этого ослож-
нения, обычно перед вычислением совпадений и
несовпадений классов из рассмотрения исключают
все общие термины.
    Сформулируем, используя теоретико-множествен-
ные операции, процедуру сопоставления новых доку-
ментов R с документами фонда D на основании их
векторов терминов и классов.
    1. Н а х о д и м D ∩ R , D \ R , R \ D .
    2. Вычисляем число А совпадений терминов из
       D∩R и число В несовпадений терминов из
       D\R и R\D.
    3. Строим вектор         класса для D\R и R\D (обоз-
       начения (D\R) C и (R\D) C ).
    4. Вычисляем числа          А' и B' совпадений и несов-
       падений (D\R) C и (R\D) C .
    5. Вычисляем значения функции f и, сравнивая
       его с пороговым значением, выносим решение
       о включении документа в фонд.
    Пример, Даны матрица,
состоящая из векторов клас-                       Таблица 36
са данного набора терминов
 Т1, Т 2 , ..., Т 8 , документ                      . Классы
                                       Термины
фонда D = (0, 0, 0, 0, 1, 1, 1, 1),            C1 С2 C3 С4 с5
новый документ R = (0, 1, 1,
 0, 0, 1, 1, 0) и пороговое зна-               1 1 a 0       a
чение |f(D, R)| ≥,0, 1. Имеем                  a 0 0 1       0
                                               a a 0 a       1
D\R = (0, 0, 0, 0, 1, 0, 0, 1),                a a a 0       1
                                               0 0 a a       1
R\D = (0, 1, 1, 0, 0, 0, 0, 0),                1  1    0   1 0
                                               1 0 1 a       0
D∩R = (0, 0, 0, 0, 0,1, 1, 0),                 1 a a a       0
            A = 2, В = 4;

                                                           203