Методы статистической обработки экологической информации: дискриминантный, корреляционный и регрессионный анализ. Буляница А.Л - 27 стр.

UptoLike

27
просто длина) и ЧСС являются метрическими величинами (тип А),
реакция на лекарства является кластерной величиной типа В. При
этом номер Класса (от 0 до 4) возрастает с возрастанием степени
чувствительности к лекарству. Однако поскольку эта степень мо*
жет быть описана только на качественном уровне (т. е. соответству*
ющим образом количественно измерить эту величину невозможно),
то она не может быть отнесена к балльным величинам (или классу
Б). Наконец, признак “цвет” формально следует отнести к типу В.
Вместе с тем, так как он принимает только два значения: б и ч, его
удобнее относить к индикаторному типу Г по схеме (0 – отсутствие
черного цвета или белый цвет и 1 – наличие черного цвета). В даль*
нейшем будем полагать именно так: 0 – белый цвет, 1 – черный
цвет.
Опишем возможные постановки задач и схемы их решения:
1. Анализ данных (каждого из признаков) с точки зрения исключе*
ния выбросов и выявления закона распределения измерений.
2. Дискриминантный анализ с целью разделения Классов 0 и 1 (т. е.
белых и черных мышей, соответственно) на основании измерений при*
знаков: масса, длина, ЧСС и реакция на лекарства.
3. Корреляционный анализ с целью выявления статистических и,
возможно, причинно*следственных связей между признаками.
4. Факторный анализ также позволяет получить данные о взаимо*
связи между признаками.
5. Регрессионный анализ позволяет связать одну из величин (в на*
шем случае – цвет или номер Классов 0–1) с измерениями признаков
масса, длина, ЧСС и реакция на лекарства.
Этап 1. Анализ измерений признаков дан в разд. 1.
Выполним расчет выборочных средних и стандартных отклонений.
Для каждого измерения оценим величину отклонения от среднего,
разделенную на величину стандартного отклонения
12 3
4
5
i
i
XX
t
.
Далее эта величина должна сравниваться с табличной величиной [1] в
соответствии с критерием Стьюдента. Число степеней свободы крите*
рия есть (n–1), где n – объем выборки. Доверительная вероятность
должна выбираться не менее 90%. В принципе, если для всех измере*
ний не очень длинной выборки (менее 120) указанная величина не пре*
восходит трех, то можно утверждать, что выбросы (резко отстоящие
значения) отсутствуют. В нашем случае никакое из измерений табли*
цы выбросом не является.