ВУЗ:
Составители:
Рубрика:
16
использованием системы Statistica с целью выявления плохо определенных
зависимостей и недостаточно изученных закономерностей.
3.3 Задание на занятие
Разбить рассматриваемую совокупность инвестиционных проектов
на отдельные кластеры по типу производства и степени его совершенства
на основании исследования параметров производственных функций.
Решение общей задачи разбивается на несколько этапов:
а) провести кластерный анализ исходных данных методом k
средних. В качестве меры расстояния между кластерами использовать
евклидово расстояние;
б) проанализировать описательные статистики полученных
кластеров, расстояния элементов до центров кластеров;
в) провести кластерный анализ исходных данных методом
иерархической кластеризации по правилам простого и полного
связывания;
г) проанализировать построенную древовидную диаграмму и
сравнить результаты иерархической кластеризации с результатами
кластеризации методом k-средних.
3.4 Методические указания по выполнению работы
Каждый студент обрабатывает свой вариант экспериментальных
данных, выданный преподавателем (примерный вариант исходных данных
приведен в таблице 4). Для вычисления необходимо использовать систему
Statistica, модуль Кластерный анализ.
3.5 Содержание отчета
Отчет должен содержать:
- заданные экспериментальные данные;
- описательные статистики кластеров, полученных методом k-
средних;
- элементы каждого кластера, полученного методом k-средних, и их
расстояние до центра кластера;
- результаты иерархической кластеризации в виде древовидной
диаграммы по правилам простого и полного связывания;
- выводы по результатам обработки экспериментальных данных.
3.6 Контрольные вопросы
Постановка задачи классификации объектов при отсутствии
априорной информации.
Основные идеи методов кластерного анализа.
использованием системы Statistica с целью выявления плохо определенных зависимостей и недостаточно изученных закономерностей. 3.3 Задание на занятие Разбить рассматриваемую совокупность инвестиционных проектов на отдельные кластеры по типу производства и степени его совершенства на основании исследования параметров производственных функций. Решение общей задачи разбивается на несколько этапов: а) провести кластерный анализ исходных данных методом k средних. В качестве меры расстояния между кластерами использовать евклидово расстояние; б) проанализировать описательные статистики полученных кластеров, расстояния элементов до центров кластеров; в) провести кластерный анализ исходных данных методом иерархической кластеризации по правилам простого и полного связывания; г) проанализировать построенную древовидную диаграмму и сравнить результаты иерархической кластеризации с результатами кластеризации методом k-средних. 3.4 Методические указания по выполнению работы Каждый студент обрабатывает свой вариант экспериментальных данных, выданный преподавателем (примерный вариант исходных данных приведен в таблице 4). Для вычисления необходимо использовать систему Statistica, модуль Кластерный анализ. 3.5 Содержание отчета Отчет должен содержать: - заданные экспериментальные данные; - описательные статистики кластеров, полученных методом k- средних; - элементы каждого кластера, полученного методом k-средних, и их расстояние до центра кластера; - результаты иерархической кластеризации в виде древовидной диаграммы по правилам простого и полного связывания; - выводы по результатам обработки экспериментальных данных. 3.6 Контрольные вопросы Постановка задачи классификации объектов при отсутствии априорной информации. Основные идеи методов кластерного анализа. 16