Математическая статистика в почвоведении. Мешалкина Ю.Л - 50 стр.

UptoLike

МЕТОД K-СРЕДНИХ. Вернитесь в самое начало анализа и выберите
Кластеризацию методом к-средних (K-means clustering).
По методу K средних будет построено K кластеров, расположенных на воз-
можно больших расстояниях друг от друга. Расчеты начинаются K кластеров,
в которые объекты объединены случайным образом. Процедура состоит в из-
менении принадлежности объектов к кластерам так, чтобы: изменчивость
внутри кластеров сделать минимальной, изменчивость между кластерами -
максимальной. Эта оценка производиться с помощью дисперсионного анали-
за. Выберите закладку Дополнительно (Advanced).
Необходимо произвести выбор переменных (Variables), по которым бу-
дет проводиться анализ (C, PHS, IL, G, V) и выбор типа анализа (для объектов
или для самих переменных) в окошке Объекты (Cluster), - точно такой, как и
при иерархической классификации.
Укажите переменные: C, PHS, IL, G, V, и выберите анализ объектов-
наблюдений (Cases (row)). Затем нужно задать Число кластеров (Number of
clusters) и число итераций для расчетов (Number of iterations). Кроме этого,
можно разным способом задать Начальные центры кластеров (Initial clus-
ter centers).
Для ваших данных проведите кластеризацию методом k-средних,
задав
3 кластера. Число итераций возьмите по умолчанию, равное 10. Начальные
центры классов задайте через одинаковые интервалы в ранжированном ряду
расстояний Сортировать расстояния и выбрать наблюдения на постоян-
ных интервалах (Sort distances and take observations at constant intervals).
Нажмите ОК.
50
      МЕТОД K-СРЕДНИХ. Вернитесь в самое начало анализа и выберите
Кластеризацию методом к-средних (K-means clustering).
По методу K средних будет построено K кластеров, расположенных на воз-
можно больших расстояниях друг от друга. Расчеты начинаются K кластеров,
в которые объекты объединены случайным образом. Процедура состоит в из-
менении принадлежности объектов к кластерам так, чтобы: изменчивость
внутри кластеров сделать минимальной, изменчивость между кластерами -
максимальной. Эта оценка производиться с помощью дисперсионного анали-
за. Выберите закладку Дополнительно (Advanced).




      Необходимо произвести выбор переменных (Variables), по которым бу-
дет проводиться анализ (C, PHS, IL, G, V) и выбор типа анализа (для объектов
или для самих переменных) в окошке Объекты (Cluster), - точно такой, как и
при иерархической классификации.
      Укажите переменные: C, PHS, IL, G, V, и выберите анализ объектов-
наблюдений (Cases (row)). Затем нужно задать Число кластеров (Number of
clusters) и число итераций для расчетов (Number of iterations). Кроме этого,
можно разным способом задать Начальные центры кластеров (Initial clus-
ter centers).
      Для ваших данных проведите кластеризацию методом k-средних, задав
3 кластера. Число итераций возьмите по умолчанию, равное 10. Начальные
центры классов задайте через одинаковые интервалы в ранжированном ряду
расстояний Сортировать расстояния и выбрать наблюдения на постоян-
ных интервалах (Sort distances and take observations at constant intervals).
Нажмите ОК.


                                    50