Математическая статистика в почвоведении. Мешалкина Ю.Л - 54 стр.

UptoLike

Занятие 6 . Метод главных компонент и дискриминантный анализ
ЦЕЛЬ занятия: провести анализ данных методом главных компонент
(МГК); выполнить дискриминантный анализ совокупности данных о горизон-
тах дерново-подзолистой почвы, оценить качество классификации; сравнить
результаты анализов.
МЕТОД ГЛАВНЫХ КОМПОНЕНТ осуществляет переход от исходных
признаков Х
1
,...,Х
p
к новой системе координат Y
1
,...,Y
р
, называемых главными
компонентами (ГК). ГК представляют собой линейные нормированные ком-
бинации исходных признаков. Они выбираются таким образом, что среди всех
возможных линейных нормированных комбинаций исходных признаков пер-
вая главная компонента Y
1
обладала наибольшей дисперсией. Вторая главная
компонента имеет наибольшую дисперсию среди всех оставшихся линейных
преобразований, некоррелированных с первой главной компонентой и пер-
пендикулярных первой главной компоненте. Следующие главные компоненты
определяются по аналогичной схеме.
Войдите в пакет STATISTICA (см. занятие 1). В программе
STATISTICA откройте файл данных для 5-6 задания для своего варианта (см.
занятие 3). Данные представляют собой результаты анализов образцов го-
ризонтов, отобранных из 5 разрезов дерново-подзолистых почв Московской
области.
Щелкнув на кнопке Анализ (Statistics), откройте меню и затем выбери-
те раздел Многомерный разведочный анализ (Multivariate Exploratory
Technique), перейдите в раздел Анализ главных компонент и классифика-
ция (Principal Components& Classification Analysis).
На следующей появившейся панели щелкните по кнопке Переменные
(Variables). В разделе Переменные анализа (Variable for analysis) задайте
признаки, по которым будет производиться анализ МГК, - в нашем случае
54
    Занятие 6 . Метод главных компонент и дискриминантный анализ
      ЦЕЛЬ занятия: провести анализ данных методом главных компонент
(МГК); выполнить дискриминантный анализ совокупности данных о горизон-
тах дерново-подзолистой почвы, оценить качество классификации; сравнить
результаты анализов.
      МЕТОД ГЛАВНЫХ КОМПОНЕНТ осуществляет переход от исходных
признаков Х1,...,Хp к новой системе координат Y1,...,Yр, называемых главными
компонентами (ГК). ГК представляют собой линейные нормированные ком-
бинации исходных признаков. Они выбираются таким образом, что среди всех
возможных линейных нормированных комбинаций исходных признаков пер-
вая главная компонента Y1 обладала наибольшей дисперсией. Вторая главная
компонента имеет наибольшую дисперсию среди всех оставшихся линейных
преобразований, некоррелированных с первой главной компонентой и пер-
пендикулярных первой главной компоненте. Следующие главные компоненты
определяются по аналогичной схеме.
      Войдите в пакет STATISTICA (см. занятие №1).              В программе
STATISTICA откройте файл данных для 5-6 задания для своего варианта (см.
занятие №3). Данные представляют собой результаты анализов образцов го-
ризонтов, отобранных из 5 разрезов дерново-подзолистых почв Московской
области.
      Щелкнув на кнопке Анализ (Statistics), откройте меню и затем выбери-
те раздел Многомерный разведочный анализ (Multivariate Exploratory
Technique), перейдите в раздел Анализ главных компонент и классифика-
ция (Principal Components& Classification Analysis).




      На следующей появившейся панели щелкните по кнопке Переменные
(Variables). В разделе Переменные анализа (Variable for analysis) задайте
признаки, по которым будет производиться анализ МГК, - в нашем случае –
                                    54