Компьютерные решения задач многомерной статистики. Часть 1. Кластерный и дискриминантный анализ. Давнис В.В - 5 стр.

UptoLike

Рубрика: 

переводятся в дихотомические по следующему правилу. Каждое из воз-
можных значений качественной переменной заменяется на 1, если качест -
венная переменная приняла это значение, и 0 в противном случае.
В тех случаях, когда все показатели количественные, часто возникает
проблема их нормирования, поскольку различие в единицах измерения де-
лает эти показатели несопоставимыми. Так, например, при классификации
промышленных предприятий по результатам финансово-хозяйственной
деятельности в описание включаются такие показатели, как прибыль, рен -
табельность, себестоимость, коэффициент текущей ликвидности и т.д. По
прибыли предприятия могут различаться на десятки и сотни тысяч единиц,
а по рентабельности на единицы , а то и десятые доли единицы . Такая не-
сопоставимость практически перечеркивает идею многомерной классифи-
кации, так как она автоматически будет осуществляться по более масштаб-
ному показателю. Поэтому процедуре непосредственного разнесения объ -
ектов по классам должна предшествовать процедура приведения всех
показателей к сопоставимому виду, которую принято называть
нормированием. В практических расчетах чаще других используются два подхода к
нормированию. Один из них связан с идеей статистической стандартизации,
осуществляемой по формуле
,
j
jij
н
ij
xx
x
σ
=
(2.2)
где
н
ij
x нормированный
j
- ый показатель
i
- го объекта;
ij
x значение
j
- го показателя
i
- го объекта;
j
x среднее значение
j
- го показателя по всему множеству классифи-
цируемых объектов;
j
σ
среднеквадратическое отклонение
j
- го показателя.
При использовании такой нормировки все показатели, описывающие
классифицируемый объект, приводятся к виду, когда среднее равно 0, а раз-
брос вокруг среднего равен 1.
Второй подход предусматривает преобразование показателей путем
отображения интервала их возможных значений на промежуток
[
]
1;0
. Это
осуществляется с помощью формулы
,
minmax
min
jj
jij
н
ij
xx
xx
x
= (2.3)
где }{min
min
ij
i
j
xx = ; }{max
max
ij
i
j
xx = .
Таким образом, с помощью нормирования удается избавиться от неже-
лательного влияния разномасштабности показателей на степень схожести
между объектами. Саму схожесть чаще всего определяют либо с помощью
перевод ят ся в д ихот ом ические по сл ед у ющ ем у пра вил у . К а ж д ое из воз-
м ож н ых зн а чен ий ка чествен н ой перем ен н ой за м ен яет ся н а 1, есл и ка чест -
вен н а я перем ен н а я прин ял а это зн а чен ие, и 0 –в прот ивн ом сл у ча е.
      В т ех сл у ча ях, когд а все пока за тел и кол ичествен н ые, ча ст о возн ика ет
пробл ем а их н орм ирова н ия, поскол ь ку ра зл ичие в ед ин ица х изм ерен ия д е-
л а ет эт и пока за т ел и н есопост а вим ым и. Т а к, н а прим ер, при кл а ссиф ика ции
пром ыш л ен н ых пред прият ий по резу л ь т а т а м ф ин а н сово-хозяйст вен н ой
д еят ел ь н ост и в описа н ие вкл юча ют ся та кие пока за т ел и, ка к прибыл ь , рен -
т а бел ь н ост ь , себестоим ост ь , коэф ф ициен т т еку щ ей л иквид н ост и и т .д . П о
прибыл и пред прият ия м огу т ра зл ича т ь ся н а д есят ки и сот н и т ысяч ед ин иц,
а по рен т а бел ь н ост и –н а ед ин ицы, а т о и д есят ые д ол и ед ин ицы. Т а ка я н е-
сопост а вим ост ь пра кт ически перечеркива ет ид ею м н огом ерн ой кл а ссиф и-
ка ции, т а к ка к он а а втом а т ически бу д ет осу щ ест вл ять ся по бол ее м а сшт а б-
н ом у пока за тел ю. П оэт ом у процед у ре н епосред ст вен н ого ра зн есен ия объ-
ектов по кл а сса м д ол ж н а пред ш ествова т ь процед у ра привед ен ия всех
пока за т ел ей к сопост а вим ом у вид у , котору ю прин ят о н а зыва т ь
н ормВи рован
           пра кти ических
                   ем.       ра счет а х ча щ е д ру гих испол ь зу ют ся д ва под ход а к
н орм ирова н ию. О д ин из н их связа н с ид еей ст а т ист ической ста н д а рт иза ции,
осу щ ест вл яем ой по ф орм у л е
                                              xij − x j
                                   xijн =                 ,                        (2.2)
                                                   σj
гд е xijн –н орм ирова н н ый j -ый пока за т ел ь i -го объект а ;
      xij –зн а чен ие j -го пока за т ел я i -го объект а ;
      x j –сред н ее зн а чен ие j -го пока за т ел я по всем у м н ож ест ву кл а ссиф и-
циру ем ых объект ов;
     σ j –сред н еква д ра т ическое откл он ен ие j -го пока за т ел я.
      П ри испол ь зова н ии т а кой н орм ировки все пока за т ел и, описыва ющ ие
кл а ссиф ициру ем ый объект, привод ят ся к вид у , когд а сред н ее ра вн о 0, а ра з-
брос вокру г сред н его ра вен 1.
      В т орой под ход пред у см а т рива ет преобра зова н ие пока за т ел ей пу т ем
от обра ж ен ия ин т ерва л а их возм ож н ых зн а чен ий н а пром еж у т ок [0; 1] . Э т о
осу щ ест вл яет ся с пом ощ ь ю ф орм у л ы
                                                  xij − x min
                                   xijн
                                                          j
                                          =                       ,               (2.3)
                                              x max
                                                j       − x min
                                                            j
гд е x min
       j   = min{xij } ;      x max
                                j   = max{xij } .
                 i                            i
       Т а ким обра зом , с пом ощ ь ю н орм ирова н ия у д а ет ся изба вит ь ся от н еж е-
л а т ел ь н ого вл иян ия ра зн ом а сш т а бн ости пока за т ел ей н а ст епен ь схож ест и
м еж д у объект а м и. Са м у схож есть ча щ е всего опред ел яют л ибо с пом ощ ь ю