Статистические методы системного анализа. Гаибова Т.В - 9 стр.

UptoLike

Рубрика: 

9
Метод главных компонентэто один из широко использующихся
методов многомерной математической статистики. Он применяется для
решения следующих задач:
- причинный анализ взаимосвязей показателей и определение их
стохастической связи с главными компонентами;
- построение обобщенных технико-экономических показателей;
- ранжирование объектов или наблюдений по главным
компонентам;
- классификация объектов наблюдений;
- сжатие исходной информации;
- построение уравнений регрессии по обобщенным технико-
экономическим показателям.
В общем виде задача снижения размерности признакового
пространства и построения интегрального показателя может быть
сформулирована следующим образом.
Пусть
N - число исследуемых объектов;
n - число признаков (измеряемых характеристик объектов -
критериев);
матрица
Y
порядка Nn
×
- совокупность всех N наблюдаемых
значений всех параметров
n после нормализации.
Необходимо описать набор критериев
n числом главных
компонент
nm
<
< , обеспечивающих долю дисперсии
γ
0,95 и
сформировать интегральный показатель оптимальности на основе матрицы
A весовых коэффициентов, учитывающих тесноту связи между
исходными критериями и главными компонентами.
FA
Y
= , где матрица F включает совокупность всех N
полученных значений всех
n главных компонент.
Или в развернутом матричном виде:
=
nNnn
N
N
nNnn
N
N
nNnn
N
N
fff
fff
fff
aaa
aaa
aaa
yyy
yyy
yyy
...
............
...
...
...
............
...
...
...
............
...
...
21
22221
11211
21
22221
11211
21
22221
11211
(9)
Задача сводится к определению матрицы
A .
Для исследования начальными основными данными являются
коэффициенты корреляции.
Связь между главными компонентами и коэффициентами
корреляции для объекта
i :
nijnijijji
fafafay
+
+
+= ...
2211
; ,,...,2,1 Ni
=
(10)
где
ji
y - нормированное значение
j
-го критерия для i -го объекта;
i
f
1
- значение первой главной компоненты для i -го объекта.
Для устранения неоднородности рассматриваемых критериев
может быть использован следующий вид нормализации:
     Метод главных компонент – это один из широко использующихся
методов многомерной математической статистики. Он применяется для
решения следующих задач:
       - причинный анализ взаимосвязей показателей и определение их
стохастической связи с главными компонентами;
       - построение обобщенных технико-экономических показателей;
       - ранжирование объектов или наблюдений по главным
компонентам;
       - классификация объектов наблюдений;
       - сжатие исходной информации;
       - построение уравнений регрессии по обобщенным технико-
экономическим показателям.
       В общем виде задача снижения размерности признакового
пространства и построения интегрального показателя       может быть
сформулирована следующим образом.
       Пусть N - число исследуемых объектов;
       n - число признаков (измеряемых характеристик объектов -
критериев);
       матрица Y порядка n × N - совокупность всех N наблюдаемых
значений всех параметров n после нормализации.
       Необходимо описать набор критериев n числом главных
компонент m << n , обеспечивающих долю дисперсии γ ≥ 0,95 и
сформировать интегральный показатель оптимальности на основе матрицы
A весовых коэффициентов, учитывающих тесноту связи между
исходными критериями и главными компонентами.
       Y = A ⋅ F , где матрица F включает совокупность всех N
полученных значений всех n главных компонент.
       Или в развернутом матричном виде:
            y11    y12    ... y1N   a11       a12    ... a1N        f11    f 12   ...   f1N 
                                                                                              
            y 21   y 22   ... y 2 N   a 21    a 22   ... a 2 N      f 21   f 22   ...   f 2N 
            ...                      =                            ⋅                                   (9)
                    ...    ... ...   ...        ...   ... ...        ...    ...    ...    ... 
                                                                                              
           y       yn2    ... y nN   a n1   an2    ... a nN     f n1   f n2   ...   f nN 
            n1
          Задача сводится к определению матрицы A .
          Для исследования начальными основными данными являются
коэффициенты корреляции.
          Связь между главными компонентами и коэффициентами
корреляции для объекта i :
                     y ji = a j1 f1i + a j 2 f 2i + ... + a jn f ni ; i = 1,2,..., N , (10)
          где y ji - нормированное значение j -го критерия для i -го объекта;
 f1i - значение первой главной компоненты для i -го объекта.
          Для устранения неоднородности рассматриваемых критериев
может быть использован следующий вид нормализации:


9