Анализ данных. Салмин А.А. - 82 стр.

UptoLike

Составители: 

82
квадратов по условиям испытаний и выражается
формулой:
2
1
P
i
ii
yynSST
.
Обратите внимание: здесь вычисляется квадрат
разницы группового среднего от общего среднего, который
умножается на количество наблюдений в группе. В данном
примере каждая группа содержит восемь наблюдений, т.е.
n=8, а межгрупповая сумма квадратов равна 21 145,38
ячейке B13).
Заметьте также, что общая сумма квадратов равна
внутригрупповой сумме квадратов + межгрупповая сумма
квадратов, так как 75 859,88 = 21 145,38 + 54 714,50, т.е.
итоговая сумма SS = SSE + SST.
Попытаемся объяснить смысл этой формулы на
рассматриваемом примере с разными услугами. Если
средние цены на разные услуги существенно отличаются,
то межгрупповая сумма квадратов будет большой, а если
они практически одинаковы будет близка к нулю. И
наоборот: большая величина межгрупповой суммы
квадратов означает существенную разницу средних цен на
услуги, а малая величина небольшую разницу.
Большая величина межгрупповой суммы квадратов
также может объясняться большим количеством групп,
поэтому в таких случаях рекомендуется настроить
количество групп в наборе данных, т.е. количество
степеней свободы в столбце df (в ячейках С13:С16) в
таблице Дисперсионный анализ. Количество степеней
свободы для фактора Услуга (который в данном случае
является условием разделения на группы) равняется
количеству групп минус 1, т.е. 4 1 = З ячейке С13). А
количество степеней свободы для общей суммы квадратов
равняется общему количеству значения наблюдений
квадратов          по       условиям   испытаний   и   выражается
формулой:
             P                2

     SST   n y  y  .
                    i   i
            i 1

     Обратите внимание: здесь вычисляется квадрат
разницы группового среднего от общего среднего, который
умножается на количество наблюдений в группе. В данном
примере каждая группа содержит восемь наблюдений, т.е.
n=8, а межгрупповая сумма квадратов равна 21 145,38 (в
ячейке B13).
     Заметьте также, что общая сумма квадратов равна
внутригрупповой сумме квадратов + межгрупповая сумма
квадратов, так как 75 859,88 = 21 145,38 + 54 714,50, т.е.
     итоговая сумма SS = SSE + SST.

     Попытаемся объяснить смысл этой формулы на
рассматриваемом примере с разными услугами. Если
средние цены на разные услуги существенно отличаются,
то межгрупповая сумма квадратов будет большой, а если
они практически одинаковы — будет близка к нулю. И
наоборот: большая величина межгрупповой суммы
квадратов означает существенную разницу средних цен на
услуги, а малая величина — небольшую разницу.
     Большая величина межгрупповой суммы квадратов
также может объясняться большим количеством групп,
поэтому в таких случаях рекомендуется настроить
количество групп в наборе данных, т.е. количество
степеней свободы в столбце df (в ячейках С13:С16) в
таблице Дисперсионный анализ. Количество степеней
свободы для фактора Услуга (который в данном случае
является условием разделения на группы) равняется
количеству групп минус 1, т.е. 4 — 1 = З (в ячейке С13). А
количество степеней свободы для общей суммы квадратов
равняется общему количеству значения          наблюдений

82