Анализ данных. Салмин А.А. - 78 стр.

UptoLike

Составители: 

78
8. ДИСПЕРСИОННЫЙ АНАЛИЗ
8.1. Однофакторный дисперсионный анализ
Дисперсионный анализ (analysis of variance ANOVA)
позволяет проверить гипотезу о равенстве средних для
всех групп.
Используемая в дисперсионном анализе модель
называется моделью средних и выражается следующей
формулой:
i
y ,
где
i
- среднее i-ой группы;
- случайная ошибка, удовлетворяющая нормальному
распределению со средним 0 и дисперсией
2
.
При наличии P групп в модели средних используются
следующие формулировки нулевой и альтернативной
гипотезы:
Нулевая гипотеза Н
0
:
P
...
21
;
Альтернативная гипотеза Н
а
: не все
i
равны.
Предположение в модели средних аналогичны
следующим предположениям в анализе регрессии:
Ошибки нормально распределены;
Ошибки независимы;
Ошибки характеризуются постоянством дисперсии.
Для осуществления дисперсионного анализа
необходимо воспользоваться командой Дисперсионный
анализ модуля Анализ данных. Для применения этого
инструмента данные каждой группы должны находиться в
разных столбцах. Если данные находятся в одном столбце
и идентифицируются категориальной переменной
предварительно необходимо привести имеющиеся данные
к нужной структуре, т.е. создать отдельные столбцы с
числовыми значениями для каждой из категории. Для
     8. ДИСПЕРСИОННЫЙ АНАЛИЗ

     8.1. Однофакторный дисперсионный анализ
     Дисперсионный анализ (analysis of variance – ANOVA)
позволяет проверить гипотезу о равенстве средних для
всех групп.
     Используемая в дисперсионном анализе модель
называется моделью средних и выражается следующей
формулой:
      y  i   ,
где  i - среднее i-ой группы;
 - случайная ошибка, удовлетворяющая нормальному
распределению со средним 0 и дисперсией  2 .
     При наличии P групп в модели средних используются
следующие формулировки нулевой и альтернативной
гипотезы:
    Нулевая гипотеза Н0: 1   2  ...   P ;
    Альтернативная гипотеза На: не все  i равны.
   Предположение в модели средних аналогичны
следующим предположениям в анализе регрессии:
    Ошибки нормально распределены;
    Ошибки независимы;
    Ошибки характеризуются постоянством дисперсии.
     Для      осуществления     дисперсионного       анализа
необходимо воспользоваться командой Дисперсионный
анализ модуля Анализ данных. Для применения этого
инструмента данные каждой группы должны находиться в
разных столбцах. Если данные находятся в одном столбце
и    идентифицируются       категориальной       переменной
предварительно необходимо привести имеющиеся данные
к нужной структуре, т.е. создать отдельные столбцы с
числовыми значениями для каждой из категории. Для

78