Компьютерные решения задач многомерной статистики. Часть 1. Кластерный и дискриминантный анализ. Давнис В.В - 19 стр.

UptoLike

Рубрика: 

(
)
ijm количество случаев , когда ошибочно объект
i
-го класса относился к
j
-му классу , то потери , связанные с допущением ошибок такого рода, бу -
дут равны
(
)
(
)
ijmijс . Чтобы посчитать общие возможные потери
n
С
при
использовании такой процедуры классификации, необходимо просуммиро -
вать величину произведения
(
)
(
)
ijmijс по всем mi ,1= и mj ,1= , т .е.
()()
ijmijcC
m
i
m
j
n
∑∑
==
=
11
. (3.1)
Чтобы потери не зависели от числа
n
классифицируемых объектов (
n
C
растет с ростом
n
), перейдем к удельной характеристике объектов, разде-
лив обе части (3.1) на
n
()()
ijmijc
n
C
n
m
i
m
j
n
∑∑
==
=
11
11
. (3.2)
Если под знаком суммы в правой части произвести преобразование,
умножив и разделив каждое слагаемое на число элементов в
i
-ом классе
(
)
nn
i
и перейдя к пределу, получим
()
(
)
(
)
()
()()
∑∑
====
∞→
==
m
i
m
i
i
i
i
m
i
m
j
n
ijPijc
nn
nnijm
ijcC
1111
lim π . (3.3)
Предел в (7.21) понимается в смысле сходимости по вероятности час-
тоты
(
)
(
)
nnijm
i
/
к вероятности отнесения объекта класса
i
к классу
j
(
)
ijP , а частоты
(
)
nnn
i
/
к вероятности извлечения объекта класса
i
из
общей совокупности классифицируемых объектов, обозначенной
i
π
.
Величина
()
()()
=
=
m
j
i
ijPijcC
1
(3.4)
определяет средние потери от неправильной классификации объектов
i
-го
класса , а вся двойная сумма (3.3) средние удельные потери от неправиль-
ной классификации всех анализируемых объектов.
В большинстве ситуаций, встречающихся на практике, можно считать,
что потери
(
)
ijс
одинаковы для любой пары
i
,
j
и могут быть представ-
лены как
()
=
=
ji
ji
ijс
при,0
при,1
. (3.5)
В этом случае задача минимизации средних удельных потерь эквивалентна
задаче максимизации вероятности правильной классификации объектов,
равной
()
()
=
=
m
i
i
i
iiPC
1
π
. (3.6)
m( j i ) кол ичест во сл у ча ев, когд а ош ибочн о объект i -го кл а сса от н осил ся к
 j -м у кл а ссу , т о пот ери, связа н н ые с д опу щ ен ием ош ибок т а кого род а , бу -
д у т ра вн ы с( j i ) m( j i ) . Ч т обы посчит а т ь общ ие возм ож н ые пот ери С n при
испол ь зова н ии т а кой процед у ры кл а ссиф ика ции, н еобход им о просу м м иро-
ва т ь вел ичин у произвед ен ия с( j i ) m( j i ) по всем i = 1, m и j = 1, m , т .е.

                         C n = ∑ ∑ c ( j i ) m( j i ) .
                                 m m
                                                                                     (3.1)
                                 i =1 j =1

      Ч т обы пот ери н е за висел и от числ а n кл а ссиф ициру ем ых объект ов ( C n
ра ст ет с рост ом n ), перейд ем к у д ел ь н ой ха ра кт ерист ике объект ов, ра зд е-
л ив обе ча ст и (3.1) н а n
                           C n = ∑ ∑ c ( j i ) m( j i ) .
                         1      1 m m
                                                                                     (3.2)
                         n      n i=1 j =1
       Е сл и под зн а ком су м м ы в пра вой ча ст и произвест и преобра зова н ие,
у м н ож ив и ра зд ел ив ка ж д ое сл а га ем ое н а числ о эл ем ен тов в i -ом кл а ссе
 ni (n ) и перейд я к пред ел у , пол у чим
                                m( j i ) ni (n )
           C = lim ∑ ∑ c( j i )                  = ∑ π i ∑ c( j i ) P ( j i ) .
                      m m                                 m      m
                                                                                     (3.3)
               n→∞   i =1 j =1               ni (n )      i =1   i =1

      П ред ел в (7.21) пон им а ет ся в см ысл е сход им ост и по вероят н ост и ча с-
т от ы m( j i ) / ni (n ) к вероят н ост и от н есен ия объект а кл а сса i к кл а ссу j
P( j i ), а ча ст от ы ni (n ) / n к вероят н ост и извл ечен ия объект а кл а сса i из
общ ей совоку пн ост и кл а ссиф ициру ем ых объект ов, обозн а чен н ой π i .
     В ел ичин а
                                     C (i ) = ∑ c ( j i ) P ( j i )
                                                 m
                                                                                     (3.4)
                                                j =1
опред ел яет сред н ие пот ери от н епра вил ь н ой кл а ссиф ика ции объектов i -го
кл а сса , а вся д войн а я су м м а (3.3) –сред н ие у д ел ь н ые пот ери от н епра вил ь -
н ой кл а ссиф ика ции всех а н а л изиру ем ых объектов.
      В бол ь ш ин стве сит у а ций, встреча ющ ихся н а пра кт ике, м ож н о счит а т ь ,
чт о пот ери с( j i ) од ин а ковы д л я л юбой па ры i , j и м огу т быт ь пред ст а в-
л ен ы ка к
                                            1, при i ≠ j
                                 с( j i ) =               .                         (3.5)
                                            0 , при i = j
В этом сл у ча е за д а ча м ин им иза ции сред н их у д ел ь н ых пот ерь эквива л ен т н а
за д а че м а ксим иза ции вероят н ост и пра вил ь н ой кл а ссиф ика ции объектов,
ра вн ой
                            C (i ) = ∑ π i P (i i ) .
                                      m
                                                                             (3.6)
                                      i =1