ВУЗ:
Составители:
Рубрика:
6
суммируются те элементы обучающей выборки, которые достоверно принад-
лежат данному классу.
б) Расстояние между образом
x
и классом
i
ϖ
определяется как рас-
стояние между этим образом и центром
i
c класса
i
ϖ
:
(, ) (,)
i
dd
ϖ
=xxc
. Напри-
мер, для
12
(, )
x
x=x
,
12
(, )cc=c
и евклидовой метрики
2
(, )
ii
d
ϖ
=− =xxc
22
11 2 2
()( )xc xc−+− =(, )−−xcxc. В частности, при классификации по двум
классам разделяющей будет линейная функция, а разделяющая поверхность
будет представлять собой прямую, являющуюся серединным перпендикуля-
ром к отрезку, соединяющему центры классов. При классификации по трем
классам их границами будут серединные перпендикуляры между их центра-
ми. Точка пересечения этих перпендикуляров – центр окружности, описан-
ной вокруг
центров классов.
В общем случае с помощью функции расстояния все пространство призна-
ков разбивается на отдельные области
1
,...,
k
VV, такие, что (, ) (, )
ji
dd<xc xc для
любой точки
j
V∈x и всех ij≠ . Такие области называются клетками Воро-
ного
. В евклидовой метрике границами клетками Вороного всегда являются
некоторые многогранники.
Метод ближайшего соседа
а) Определяется тот элемент
s
x обучающей выборки, который ближе
всего к предъявленному образу
x
, т.е.
{
}
min : 1,...,
si
in−= − =xx xx .
б) Проверяется условие: если
s
i
ϖ
∈x , то считается, что и
i
ϖ
∈x . В этом
случае функция расстояния определяется по формуле
(, ) min
ik
d
ϖ
=−xxx,
ki
ϖ
∈x .
Определение расстояния от образа до эталонного образа
Этот способ основан на введении эталонных образов и на знании
структурных или геометрических свойств классов. При этом выделяется не-
которое множество элементов обучающей выборки (так называемые
эталон-
ные образы), вокруг которых формируются другие образы обучающей вы-
борки. Такие однородные структуры внутри класса группируются вокруг од-
ного эталонного образа, называемого
кластером.
Если эталонные образы известны, то расстояние между предъявленным
образом
x и классом
i
ϖ
можно определить по формуле
(, ) min
ik
d
ϖ
=−xxc,
ki
ϖ
∈c ,
где
i
ϖ
– эталонный образ. Задача разбиения обучающей выборки на класте-
ры называется
кластеризацией. Алгоритмы кластеризации рассматриваются
ниже.
Практическая часть.
1.
Построить клетки Вороного для двухточечных множеств в метри-
ках Евклида, Хэмминга, Минковского, Канберра, а также равномерной.
2.
Построить клетки Вороного для трехточечных множеств в метриках
Евклида, Хэмминга, Минковского, Канберра, а также равномерной.
Страницы
- « первая
- ‹ предыдущая
- …
- 4
- 5
- 6
- 7
- 8
- …
- следующая ›
- последняя »