Компьютерные решения задач многомерной статистики. Часть 1. Кластерный и дискриминантный анализ. Давнис В.В - 18 стр.

UptoLike

Рубрика: 

Таблица 2.3.4
Банк
Чистые активы,
тыс. руб.
Ликвидные активы,
тыс. руб.
Суммарные обязательства,
тыс. руб.
1 728481,825 12731,458 1527149,283
2 43831,446 -24198,034 79374,219
3 19973,371 629,285 27452,437
4 26484,649 -16262,703 31193,252
5 20393,837 3483,837 29484,226
6 174967 6783,932 260847,887
7 137371,384 3197,923 12736,83
8 62763,913 6158,736 97264,837
9 183,837 -189,78 18373,803
10 11836,91 -414,712 19724,46
3. ДИСКРИМИНАНТНЫЙ АНАЛИЗ
3.1. Теоретические основы
Дискриминантный анализ это метод многомерной классификации,
преследующий цель разделения объектов на группы при наличии началь-
ных представлений о характере групп, т .е. наличии обучающих выборок.
Под обучающими выборками понимаются наблюдения, относительно кото-
рых известно, к какому классу они принадлежат, а точнее из каких гене-
ральных совокупностей они извлечены. Для понимания сути дискрими-
нантного анализа возникает необходимость в уточнении понятия «класс».
Класс это генеральная совокупность, описываемая одномодальной функ-
цией плотности
(
)
xf (или одномодальным полигоном вероятностей в слу-
чае дискретных признаков).
В основу вероятностных методов классификации (дискриминантный
анализ это вероятностный метод ) положен принцип, в соответствии с ко-
торым наблюдение относится к тому классу (т.е. к той генеральной сово-
купности), в рамках которого (которой) оно выглядит более правдоподоб-
ным. Для практической реализации этого принципа необходимо распола-
гать полным описанием гипотетических классов, т.е. знанием функций
(
)
(
)
(
)
xxx
m
fff ,,,
21
K
, задающих закон распределения вероятностей, соот-
ветственно, для 1-го, 2-го, . . . ,
m
-го классов. Затруднения, связанные с от-
сутствием такого описания, обходят с помощью обучающих выборок.
Основным требованием к методам классификации является требование,
состоящее в том , чтобы их применение минимизировало потери (или веро -
ятность) неправильной классификации объектов. Для этого вводится вели-
чина
(
)
ijс потерь , которые будут иметь место, при отнесении одного объ -
екта
i
-го класса к
j
-му классу (при
j
i
=
(
)
0=ijс
). Если обозначить через
                                                                                    Табли ца 2.3.4
                Ч ист ые а кт ивы,      Л иквид н ые а кт ивы,   Су м м а рн ые обяза т ел ь ст ва ,
    Ба н к
                    тыс. ру б.               т ыс. ру б.                     тыс. ру б.
      1               728481,825                12731,458                       1527149,283
      2                43831,446               -24198,034                          79374,219
      3                19973,371                   629,285                         27452,437
      4                26484,649               -16262,703                          31193,252
      5                20393,837                  3483,837                         29484,226
      6                     174967                6783,932                        260847,887
      7               137371,384                  3197,923                           12736,83
      8                62763,913                  6158,736                         97264,837
      9                    183,837                 -189,78                         18373,803
     10                  11836,91                 -414,712                           19724,46



                       3. Д И С К РИ М И Н А Н ТН Ы Й А Н А Л И З

        3.1. Т ео рети чес к и е о с но вы
        Ди скри м и н ан тн ы й ан али з – эт о м ет од м н огом ерн ой кл а ссиф ика ции,
пресл ед у ющ ий цел ь ра зд ел ен ия объектов н а гру ппы при н а л ичии н а ча л ь -
н ых пред ст а вл ен ий о ха ра кт ере гру пп, т .е. н а л ичии обу ча ющ их выборок.
П од обучающи м и вы борка м и пон им а ются н а бл юд ен ия, от н осит ел ь н о кот о-
рых извест н о, к ка ком у кл а ссу он и прин а д л еж а т , а т очн ее –из ка ких ген е-
ра л ь н ых совоку пн ост ей он и извл ечен ы. Д л я пон им а н ия су т и д искрим и-
н а н т н ого а н а л иза возн ика ет н еобход им ость в у т очн ен ии пон ят ия «кл а сс».
К ласс –эт о ген ера л ь н а я совоку пн ост ь , описыва ем а я од н ом од а л ь н ой ф у н к-
цией пл от н ост и f (x ) (ил и од н ом од а л ь н ым пол игон ом вероят н ост ей в сл у -
ча е д искрет н ых призн а ков).
        В осн ову вероят н ост н ых м етод ов кл а ссиф ика ции (д искрим ин а н т н ый
а н а л из –эт о вероят н ост н ый м ет од ) пол ож ен прин цип, в соот вет ст вии с ко-
т орым н а бл юд ен ие от н осит ся к том у кл а ссу (т .е. к т ой ген ера л ь н ой сово-
ку пн ост и), в ра м ка х кот орого (кот орой) он о выгл яд ит бол ее пра вд опод об-
н ым . Д л я пра кт ической реа л иза ции этого прин ципа н еобход им о ра спол а -
га т ь пол н ым описа н ием гипот ет ических кл а ссов, т.е. зн а н ием ф у н кций
 f1 (x ), f 2 (x ), K , f m (x ), за д а ющ их за кон ра спред ел ен ия вероят н ост ей, соот -
вет ст вен н о, д л я 1-го, 2-го, . . . , m -го кл а ссов. З а тру д н ен ия, связа н н ые с от -
су т ст вием та кого описа н ия, обход ят с пом ощ ь ю обу ча ющ их выборок.
        О сн овн ым т ребова н ием к м ет од а м кл а ссиф ика ции явл яет ся требова н ие,
сост оящ ее в т ом , чт обы их прим ен ен ие м ин им изирова л о пот ери (ил и веро-
ят н ост ь ) н епра вил ь н ой кл а ссиф ика ции объектов. Д л я эт ого ввод ит ся вел и-
чин а с( j i ) потерь , кот орые бу д у т им ет ь м ест о, при от н есен ии од н ого объ-
ект а i -го кл а сса к j -м у кл а ссу (при i = j с( j i ) = 0 ). Е сл и обозн а чит ь через