Методы статистической обработки экологической информации: дискриминантный, корреляционный и регрессионный анализ. Буляница А.Л - 6 стр.

UptoLike

6
2. ДИСКРИМИНАНТНЫЙ (КЛАСТЕРНЫЙ) АНАЛИЗ
В Приложении представлены гелио* и метеофакторы в дни, когда
происходили (или не происходили) случаи внезапной смерти от сер*
дечно*сосудистых патологий. Важнейший вопрос: имеются ли разли*
чия в показателях гелио* (гео*, метео*) признаков в эти дни. Объеди*
ним все измерения, выполненные в те дни, в которые не наблюдались
случаи внезапной смерти в группу (класс), называемый в дальнейшем
“Класс 0”, а измерения, осуществленные в дни, когда регистрирова*
лись случаи внезапной смерти в другую группу, называемую далее
“Класс 1”. Рассмотрим следующую задачу: оценим возможность раз*
деления (дискриминации) классов на основе измерений признаков. Для
решения указанной задачи следует оценить значимость различий
между средними значениями признаков
1 2 3
10
()/tMM
, где М
i
– вы*
борочные средние значений признаков для Классов 1 и 0 соответ*
ственно; d – взвешенное стандартное отклонение средних, рассчи*
танное по формуле
123 12
45
331
22
0011
0101
(1)(1)
()( 2)
NN
NNNN
.
Здесь N
i
– число измерений в Классах 0 или 1, а
1
2
i
– дисперсия изме*
рений заданного признака в рамках Классов 0 или 1 соответственно.
Известно, что если сам признак представляет собой нормально рас*
пределенную случайную величину, то величина t удовлетворяет рас*
пределению Стъюдента с 12
01
2NN степенями свободы. Эта величина
табулирована [1], т. е. всегда можно определить вероятность того, что
при заданном значении t измерения из обоих классов принадлежат
одной выборке. Очевидно, что чем меньше указанная вероятность Р,
тем сильнее дискриминация классов. Как правило, говорить о досто*
верном разделении классов можно, если Р < 0,01 (иногда P < 0,05).
Даже если исходная случайная величина распределена по закону,
далекому от нормального, распределение выборочного среднего (при
достаточно больших N
i
) весьма близко к нормальному. Поэтому ко*
личественная ошибка от использования критерия Стьюдента в этом
случае будет невелика.