ВУЗ:
Составители:
образом, каждый объект некоторого множества описывается набором
из n чисел, и по сути, является точкой в п ространстве R
n
.
В таблице 1 представлены три характерных пр изнака ряда автомо-
билей.
Табл. 1. Исходные данные
цена расход разгон до
(руб.) (л./100 км.) 100 км./ч (с.)
1. Лада Ка лина 260 000 9.8 12.9
2. Renault Logan 370 000 10.0 11.5
3. Huyndai Getz 450 000 7.6 9.6
4. Toyota Prius 1 100 000 3.9 10.4
5. Mitsubishi Lancer 1 300 000 13.8 7.0
1.3. Шкалирование данных. Прежде чем анализирова ть дан-
ные, их необходимо нормализовать. Это нужно для того, чтобы уров-
нять вклад каждого признака. Для этого данные центрируют (вычи-
тают из каждого признака среднее значение) и нормируют (делят на
среднее квадратичное отклонение). В та блице 2 приведены нормализо-
ванные данные таблицы 1:
Табл. 2. Нормализованные данные
№ 1 2 3
1 −1.05 0.24 1.53
2 −0.77 0.30 0.44
3 −0.58 −0.45 −0.4 0
4 0.96 −1.57 −0.04
5 1.44 1.48 −1.53
7
образом, каждый объект некоторого множества описывается набором
из n чисел, и по сути, является точкой в пространстве Rn .
В таблице 1 представлены три характерных признака ряда автомо-
билей.
Табл. 1. Исходные данные
цена расход разгон до
(руб.) (л./100 км.) 100 км./ч (с.)
1. Лада Калина 260 000 9.8 12.9
2. Renault Logan 370 000 10.0 11.5
3. Huyndai Getz 450 000 7.6 9.6
4. Toyota Prius 1 100 000 3.9 10.4
5. Mitsubishi Lancer 1 300 000 13.8 7.0
1.3. Шкалирование данных. Прежде чем анализировать дан-
ные, их необходимо нормализовать. Это нужно для того, чтобы уров-
нять вклад каждого признака. Для этого данные центрируют (вычи-
тают из каждого признака среднее значение) и нормируют (делят на
среднее квадратичное отклонение). В таблице 2 приведены нормализо-
ванные данные таблицы 1:
Табл. 2. Нормализованные данные
№ 1 2 3
1 −1.05 0.24 1.53
2 −0.77 0.30 0.44
3 −0.58 −0.45 −0.40
4 0.96 −1.57 −0.04
5 1.44 1.48 −1.53
7
Страницы
- « первая
- ‹ предыдущая
- …
- 5
- 6
- 7
- 8
- 9
- …
- следующая ›
- последняя »
