Программное обеспечение процессов и систем. Щеников Я.А. - 40 стр.

UptoLike

Составители: 

40
Y = pdist(Х)
Y = pdist(Х,’metric’)
Y = pdist(Х, ‘minkowski’,p)
Х – матрица данных, имеющая m строк и n столбцов, рассматривае-
мая как совокупность m векторов с n элементами каждый.
‘metric’ – строковая переменная, принимающая возможные значения:
‘Euclid’ – евклидово расстояние;
‘SEuclid’ – нормализованное евклидово расстояние;
‘Mahal’ – расстояние Махаланобиса;
‘CityBlock’ – расстояние по Манхэттену (расстояние Хэмминга);
‘Minkovski’ – расстояние в метрике Минковского;
p – некоторое фиксированное число, показатель метрики Минковско-
го (по умолчанию p = 2).
Возвращаемая величина Y – вектор с (m – 1)m/2 элементами, кото-
рые являются расстояниями, соответственно, между вектором 1 и век-
тором 2, вектором 1 и вектором 3… вектором 1 и вектором m… векто-
ром m–1 и вектором m.
Функция linkage(Y) возвращает иерархическое дерево кластеров,
используя по умолчанию алгоритм «ближайшего соседа». Является
исходной для ряда других функций, в частности для функции построе-
ния дендрограммы dendrogramm
Z = linkage(Y)
Z = linkage(Y, ‘method’)
Аргументами функции являются вектор Y расстояний между m
объектами, возвращаемый функцией pdist, и строковая переменная
‘method’ (метод), которая задает метод кластеризации и может прини-
мать одно из следующих значений:
‘single’ – алгоритм «ближайшего соседа»;
‘complete’ – алгоритм «дальнего соседа»;
‘average’ – алгоритм «средней связи»;
‘centroid’ – центроидный алгоритм, использующий расстояние по «цен-
трам тяжести» групп;
‘ward’ – пошаговый алгоритм.
Функция возвращает матрицу Z, имеющую m – 1 строку и 3 столбца
и содержащую информацию об иерархическом дереве кластеров. Ниж-
ний уровень иерархии образован m исходными объектами (векторами),
которые затем объединяются попарно (в зависимости от расстояния