ВУЗ:
Составители:
Рубрика:
где )2( −+
α
nmt – табличное значение соответствующей односторонней критической границы рапределения Стьюдента.
Аналогично предыдущему пункту все формулы для выборок не из нормальных генеральных совокупностей считаются при-
менимыми при m, n ≥ 20 ÷ 30.
Остается обсудить предположение о равенстве дисперсий. На практике вначале проверяют гипотезу о равенстве дис-
персий
X
и
Y
, и если нет оснований отклонить ее, то рассматриваемый критерий сравнения средних считают применимым.
Отметим, что две выборочные дисперсии должны отличаться довольно сильно (в 3 – 5 раз), чтобы были основания откло-
нить возможность равенства их генеральных значений, поэтому рассматриваемый критерий оказывается применимым весь-
ма часто.
Пример. Исходя из данных предыдущего примера можно ли утверждать, что девушки в среднем учатся лучше ребят?
Принять уровень значимости проверки гипотезы
05,0
=
α .
Решение. Рассматриваем нулевую гипотезу
YX
aaH
=
:
0
. Против альтернативной односторонней гипотезы
YX
aaH <:
1
.
Находим, что
71,4
2525
)22525(2525
1502430024
400420
=
+
−+⋅⋅
⋅+⋅
−
=t
.
По таблицам находим критическое значение
68,1)22525(
05,0кр
=−+= tt
. Рассчитанное значение больше его, следовательно дей-
ствительно результаты девушек значимо превосходят успехи ребят.
4.5. Однофакторный дисперсионный анализ
Важное место в методах статистического анализа реальных данных и принятия соответствующих практических реше-
ний занимают приемы дисперсионного анализа. Суть этого анализа сводится к расчленению общей дисперсии некоторого
показателя на компоненты, обусловленные влиянием отдельных факторов, и проверке гипотез о значимости этого влияния.
Существует многофакторный дисперсионный анализ, но мы пока разберем простейший случай.
Пусть имеется выборка объема n значений некоторой интересующей нас величины Х (например, некоторого экономи-
ческого показателя). Задача состоит в выявлении ее зависимости от некоторого фактора
Z
. При этом фактор
Z
обычно ха-
рактеризуется не численно, а некоторыми своими уровнями (категориями признака). При числовом выражении уровня
Z
для решения задачи более пригодным может оказаться коэффициент корреляции.
Разобьем имеющуюся статистику на, так называемые, частичные выборки
),1(....,,,
21
miXXX
m
ikii
= , каждая из кото-
рых соответствует своему уровню фактора
Z
. Здесь
i
k – количество элементов выборки, которые соответствуют объектам.
Если значение фактора непрерывно, тогда разбиение производится в смысле соответствия реализаций некоторому ин-
тервалу из общего диапазона значений фактора.
Эти выборки и соответствующие им промежуточные величины записывают в виде таблицы, которую называют табли-
цей дисперсионного анализа (табл. 4.1.).
Общую сумму квадратов отклонений от
X
, т.е. общую вариацию данных можно разбить на два слагаемых:
∑∑ ∑∑ ∑
=
Σ
+=−+−=−=
m
i
k
jij
m
i
i
i
j
ijij
i
QQXXkXXXXQ
1
21
222
)()()( ,
где
1
Q – называется внутригрупповой вариацией,
2
Q – межгрупповой вариацией. Ясно, что чем сильнее влияние фактора
Z
на величину Х, тем относительно большей будет составляющая
2
Q .
Таблица 4.1.
Номер выборки
Наблюденное
значение
Объем выборки
Групповая
средняя
1
1
11211
,....,,
k
XXX
1
k
1
1
1
1
1
k
X
X
k
j
j
∑
=
=
::::
::::
::::
::::
::::
::::
::::
::::
::::
::::
::::
::::
:::::::::::
m
m
mkmm
XXX ,....,,
21
m
k
m
k
j
mj
m
k
X
X
m
∑
=
=
1
∑
=
m
j
j
kn
n
X
X
m
i
k
j
ij
i
∑∑
==
=
11
Страницы
- « первая
- ‹ предыдущая
- …
- 44
- 45
- 46
- 47
- 48
- …
- следующая ›
- последняя »