Математическое моделирование в социологии. Абзалилов Д.Ф. - 29 стр.

UptoLike

Составители: 

§ 6. Метод главных компонент
6.1. Основная идея метода. Метод главны х компонент за-
ключается в уменьшении количества исходных данных матрицы X
“объект–признак”, потеряв при этом наименьшее количество инфор-
мации. Уменьшение данных происходит путем сокращения числа при-
знаков. Если первоначальная матрица X содержала n столбцов, то
полученная в результате применения метода главных компоне нт мат-
рица Y будет содержать r < n столбцов.
Данные, содержащиеся в матрице X обычно содержат н ужную
нам информацию, но они могут быть избыточными. Кроме того, дан-
ные могут с одержать в себе нежелательную составляющую, называе-
мую шумом. Природа этого шума может быть различной. Что считать
шумом, а что информацией, всегда решается с учетом п оставленных
целей и методов.
В результате применения метода главных компонент, мы пер ехо-
дим от исходного пространства восприятия с большим количеством
признаков к новому пре дставлению, размерность которого з начитель-
но меньше. Часто удается упростить да нные на порядки: от 1000 при-
знаков перейти всего к двум. При этом ничего не выбрасыва ется все
признаки учитываются. В то же в ремя несущественна я для сути де-
ла часть данных отделяется, пр евращается в шум. Найденные главные
компоненты и дают искомые скрытые признаки, управляющие устрой-
ством данных.
29
§ 6.   Метод главных компонент

    6.1. Основная идея метода. Метод главных компонент за-
ключается в уменьшении количества исходных данных матрицы X
“объект–признак”, потеряв при этом наименьшее количество инфор-
мации. Уменьшение данных происходит путем сокращения числа при-
знаков. Если первоначальная матрица X содержала n столбцов, то
полученная в результате применения метода главных компонент мат-
рица Y будет содержать r < n столбцов.
    Данные, содержащиеся в матрице X обычно содержат нужную
нам информацию, но они могут быть избыточными. Кроме того, дан-
ные могут содержать в себе нежелательную составляющую, называе-
мую шумом. Природа этого шума может быть различной. Что считать
шумом, а что – информацией, всегда решается с учетом поставленных
целей и методов.
    В результате применения метода главных компонент, мы перехо-
дим от исходного пространства восприятия с большим количеством
признаков к новому представлению, размерность которого значитель-
но меньше. Часто удается упростить данные на порядки: от 1000 при-
знаков перейти всего к двум. При этом ничего не выбрасывается – все
признаки учитываются. В то же время несущественная для сути де-
ла часть данных отделяется, превращается в шум. Найденные главные
компоненты и дают искомые скрытые признаки, управляющие устрой-
ством данных.




                                29