Математическое моделирование в социологии. Абзалилов Д.Ф. - 33 стр.

UptoLike

Составители: 

Можно убедиться, что матрицы U и V являются ортогональными
и USV
T
= A.
6.4. Описание метода главных компонент. Суть метода
главных компонент заключается в поиске разложения
X = Y P
T
+ F,
где Y называется матрицей счетов (она содержит главные компоненты
матрицы X данных), P матрица нагрузок (фактически являющейся
матрицей проектирования), F матрица остатков (содержит шум).
Матрицы X и F имеют размерность m × n, матрица Y m × r,
матрица P n × r.
Столбцы матр ицы Y содержат числовые значения новых п р изна-
ков, а столбцы матрицы P нагрузок представляют собой координаты
единичных векторов, направленных по новым осям. Важным свойством
метода главных компонент является следующее: если число новых при-
знаков увеличивается, то матрицы Y и P н е пересчитываются, к ним
просто добавляются новые столбцы, соответствующие добавляемым
признакам.
Для нахождения матрицы P используется сингулярное разложе-
нием матрицы X. Вначале требуется оп ределить число r главных ком-
понент. Это можно сделать по методу описанному в разделе 5.4 для
собственных чисел λ
k
матрицы XX
T
или X
T
X. Затем из первых r
столбцов матрицы V формируется матрица P . После того как мат-
рица P найдена, нахождение Y по X происходит п о формуле (6.1).
Матрицу ошибок находят по формуле F = X Y P
T
.
Полученные таким образом матрицы P и Y не будут единстве н -
ным решен ие м поставленн ой задачи. Ту же самую матрицу ошибок
можно получить, если взять в качестве матрицы нагрузок
e
P = P T , а
в качестве матрицы счетов
e
Y = Y T , где T ортогональная матрица
33
    Можно убедиться, что матрицы U и V являются ортогональными
и U SV T = A.
    6.4. Описание метода главных компонент. Суть метода
главных компонент заключается в поиске разложения

     X = Y P T + F,

где Y называется матрицей счетов (она содержит главные компоненты
матрицы X данных), P – матрица нагрузок (фактически являющейся
матрицей проектирования), F – матрица остатков (содержит шум).
Матрицы X и F имеют размерность m × n, матрица Y – m × r,
матрица P – n × r.
    Столбцы матрицы Y содержат числовые значения новых призна-
ков, а столбцы матрицы P нагрузок представляют собой координаты
единичных векторов, направленных по новым осям. Важным свойством
метода главных компонент является следующее: если число новых при-
знаков увеличивается, то матрицы Y и P не пересчитываются, к ним
просто добавляются новые столбцы, соответствующие добавляемым
признакам.
    Для нахождения матрицы P используется сингулярное разложе-
нием матрицы X. Вначале требуется определить число r главных ком-
понент. Это можно сделать по методу описанному в разделе 5.4 для
собственных чисел λk матрицы XX T или X T X. Затем из первых r
столбцов матрицы V формируется матрица P . После того как мат-
рица P найдена, нахождение Y по X происходит по формуле (6.1).
Матрицу ошибок находят по формуле F = X − Y P T .
    Полученные таким образом матрицы P и Y не будут единствен-
ным решением поставленной задачи. Ту же самую матрицу ошибок
можно получить, если взять в качестве матрицы нагрузок Pe = P T , а
в качестве матрицы счетов Ye = Y T , где T – ортогональная матрица

                                33