Компьютерные решения задач многомерной статистики. Часть 1. Кластерный и дискриминантный анализ. Давнис В.В - 15 стр.

UptoLike

Рубрика: 

11. Выбрать Матрица расстояний (Distance matrix). В результате поя-
вится следующая матрица :
C_1
C_2
C_3
C_4
C_5
C_6
C_7
C_8
C_9
C_10
C_11
C_12
C_1
0,00
1,26
1,35
2,35
2,42
2,29
2,46
2,31
2,60
2,49 1,91 2,21
C_2
1,26
0,00
1,14
1,45
1,47
1,34
1,49
1,41
1,64
1,56 1,32 1,21
C_3
1,35
1,14
0,00
1,61
1,70
1,48
1,72
1,41
1,86
1,77 1,27 1,56
C_4
2,35
1,45
1,61
0,00
0,46
0,58
0,51
0,69
0,62
0,53 1,13 0,47
C_5 2,42
1,47
1,70
0,46
0,00
0,41
0,10
0,71
0,20
0,11 1,43 0,33
C_6
2,29
1,34
1,48
0,58
0,41
0,00
0,37
0,36
0,52
0,47 1,27 0,47
C_7
2,46
1,49
1,72
0,51
0,10
0,37
0,00
0,67
0,18
0,15 1,47 0,35
C_8
2,31
1,41
1,41
0,69
0,71
0,36
0,67
0,00
0,81
0,78 1,19 0,70
C_9
2,60
1,64
1,86
0,62
0,20
0,52
0,18
0,81
0,00
0,13 1,61 0,50
C_10
2,49
1,56
1,77
0,53
0,11
0,47
0,15
0,78
0,13
0,00 1,50 0,44
C_11
1,91
1,32
1,27
1,13
1,43
1,27
1,47
1,19
1,61
1,50 0,00 1,36
C_12
2,21
1,21
1,56
0,47
0,33
0,47
0,35
0,70
0,50
0,44 1,36 0,00
Анализ полученной дендрограммы, матрица расстояний и схемы объе -
динения с деревом кратчайших расстояний, построенным в среде MS Excel,
позволяют сделать вывод о полной идентичности результатов кластерного
анализа , проведенного с использованием табличного процессора MS Excel
и пакета STATISTICA.
12. Нажать на кнопку Описательные статистики (Descriptive statis-
tics), получить таблицу результатов со средними значениями (Mean) и
стандартными отклонениями (Std. Dev.) для каждой переменной, исполь-
зуемой в описании классифицируемых объектов (см . табл . 2.2.5).
Таблица 2.2.5
Описательные статистики
Variable
Mean Std. Dev.
Var1
0,211938
0,372409
Var2
0,434637
0,343888
Var3
0,143409
0,282025
Var4
0,185607
0,291957
Var5
0,420639
0,394442
Var6
0,256741
0,356183
Var7
0,215338
0,305987
Var8
0,343302
0,312793
2.3. Задания для самостоятельной работы
Задание 2.3.1. На предприятии «Прогресс» функционируют 16 научно-
производственных отделов, занятых выпуском различной продукции, работ
и услуг. Поскольку виды деятельности, количество работающих, рента-
бельность отделов, существенно различаются между собой, было решено
сгруппировать отделы в несколько однородных групп, а затем для каждой
группы разработать свою систему премирования. После тщательного ана-
     11. В ыбра ть М атри ца рас с то я ни й (Distance matrix). В резу л ь т а т е поя-
вит ся сл ед у ющ а я м а т рица :
           C_1    C_2    C_3    C_4    C_5     C_6    C_7    C_8     C_9 C_10 C_11 C_12
   C_1     0,00   1,26   1,35   2,35   2,42    2,29   2,46   2,31    2,60 2,49 1,91 2,21
   C_2     1,26   0,00   1,14   1,45   1,47    1,34   1,49   1,41    1,64 1,56 1,32 1,21
   C_3     1,35   1,14   0,00   1,61   1,70    1,48   1,72   1,41    1,86 1,77 1,27 1,56
   C_4     2,35   1,45   1,61   0,00   0,46    0,58   0,51   0,69    0,62 0,53 1,13 0,47
   C_5     2,42   1,47   1,70   0,46   0,00    0,41   0,10   0,71    0,20 0,11 1,43 0,33
   C_6     2,29   1,34   1,48   0,58   0,41    0,00   0,37   0,36    0,52 0,47 1,27 0,47
   C_7     2,46   1,49   1,72   0,51   0,10    0,37   0,00   0,67    0,18 0,15 1,47 0,35
   C_8     2,31   1,41   1,41   0,69   0,71    0,36   0,67   0,00    0,81 0,78 1,19 0,70
   C_9     2,60   1,64   1,86   0,62   0,20    0,52   0,18   0,81    0,00 0,13 1,61 0,50
   C_10    2,49   1,56   1,77   0,53   0,11    0,47   0,15   0,78    0,13 0,00 1,50 0,44
   C_11    1,91   1,32   1,27   1,13   1,43    1,27   1,47   1,19    1,61 1,50 0,00 1,36
   C_12    2,21   1,21   1,56   0,47   0,33    0,47   0,35   0,70    0,50 0,44 1,36 0,00

        А н а л из пол у чен н ой д ен д рогра м м ы, м а т рица ра сст оян ий и схем ы объе-
д ин ен ия с д еревом кра тча йш их ра сст оян ий, построен н ым в сред е MS Excel,
позвол яют сд ел а т ь вывод о пол н ой ид ен т ичн ост и резу л ь т а т ов кл а ст ерн ого
а н а л иза , провед ен н ого с испол ь зова н ием т а бл ичн ого процессора MS Excel
и па кет а STATISTICA.
        12. Н а ж а т ь н а кн опку О пи с ательны е с тати с ти к и (Descriptive statis-
tics), пол у чит ь т а бл ицу резу л ь т а тов со сред н им и зн а чен иям и (Mean) и
ст а н д а рт н ым и от кл он ен иям и (Std. Dev.) д л я ка ж д ой перем ен н ой, испол ь -
зу ем ой в описа н ии кл а ссиф ициру ем ых объект ов (см . т а бл . 2.2.5).
                                                                               Табли ца 2.2.5
                                О пис а т е льные ст а т ист ик и
                                 Variable       Mean     Std. Dev.
                                  Var1        0,211938   0,372409
                                  Var2        0,434637   0,343888
                                  Var3        0,143409   0,282025
                                  Var4        0,185607   0,291957
                                  Var5        0,420639   0,394442
                                  Var6        0,256741   0,356183
                                  Var7        0,215338   0,305987
                                  Var8        0,343302   0,312793

      2.3. Задани я для с амо с то я тельно й рабо ты
      З а да ние 2.3.1. Н а пред прият ии «П рогресс» ф у н кцион иру ют 16 н а у чн о-
производ ст вен н ых от д ел ов, за н ят ых выпу ском ра зл ичн ой прод у кции, ра бот
и у сл у г. П оскол ь ку вид ы д еят ел ь н ости, кол ичество ра бот а ющ их, рен т а -
бел ь н ост ь от д ел ов, су щ ест вен н о ра зл ича ют ся м еж д у собой, был о реш ен о
сгру ппирова т ь от д ел ы в н ескол ь ко од н ород н ых гру пп, а за т ем д л я ка ж д ой
гру ппы ра зра бот а т ь свою сист ем у прем ирова н ия. П осл е т щ а т ел ь н ого а н а -