ВУЗ:
Составители:
Рубрика:
65
Далее формулируют функцию вида
1
1
(),
n
ii
k
NFx
N
=
å
где N — число наблюдений всего, N
i
— число наблюдений в совокупно-
сти i, n — число совокупностей (на одну меньше числа вершин).
Затем выдвигается гипотеза, что исследуемая случайная величина
имеет данную функцию распределения. Затем она проверяется в обычном
порядке по критерию
c
2
, только для определения теоретических частот
вместо обычной F(x), соответствующей одному из известных распределе-
ний, используется данная функция, а при расчёте числа степеней свободы
учитывается общее количество параметров, определённых на основе эмпи-
рического распределения для всех F
i
(x).
4. Проверка независимости факторов с помощью
критерия
c
2
Критерий
c
2
очень удобен для проверки независимости двух дис-
кретных переменных. Если имеется набор наблюдений, в каждом из кото-
рых зафиксировано значение двух дискретных переменных, такой, что ка-
ждой паре значений дискретных переменных теоретическая частота, со-
ставляющая не менее 6-8 наблюдений, то с помощью данного критерия
можно, не привлекая никаких других теоретических соображений, сделать
заключение о том, проявляется ли какая-либо зависимость между этими
переменными в имеющихся результатах наблюдений.
При достаточной численности наблюдений данный критерий наи-
лучшим образом соответствует целям практического задания к теме 3 при
проверке независимости переменных. Если гипотеза о независимости двух
факторов отвергается, один из них должен быть исключён из модели и за-
менён другим. Если гипотеза о независимости результата от фактора не
отвергается, фактор также следует исключить из модели, заменив его дру-
гим.
Процедура проверки предполагает следующие этапы:
¨ подсчёт числа наблюдений, для каждого сочетания значений двух
переменных;
¨ подсчёт теоретической частоты n'
ij
для каждого сочетания значе-
ний двух переменных, составляющей n
1i
·n
2j
/N, где n
1i
— число наблюдений
66
i-го значения первой переменной, n
2j
— число наблюдений j-го значения
второй переменной;
¨ расчёт значения критерия
c
2
по формуле
12
2
11
()
,
kk
ijij
ij
ij
nn
n
==
¢
-
¢
åå
где k
1
— число значений первой переменной; k
2
— число значений второй
переменной; n
ij
— фактическое число наблюдений, при которых первая
переменная принимала значение i, а вторая — значение j; остальные обо-
значения прежние;
¨ определение критического уровня
c
2
для заданной доверительной
вероятности и числа степеней свободы (k
1
–1)·(k
2
–1) — например, с помо-
щью формулы Excel
=ХИ2ОБР(1-УровеньДоверия;(_k1-1)*(_k2-1)),
где в ячейке УровеньДоверия содержится требуемая доверительная ве-
роятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2
— число значений соответствующих дискретных переменных. В MathCad
аналогичный расчёт выполняется с помощью формулы
qchisq(1-УровеньДоверия;(k1-1)*(k2-1));
¨ сравнение фактического и критического значений
c
2
и заключе-
ние о том, следует ли отвергнуть предложенную теоретическую модель
распределения случайной величины.
Если значение
c
2
превышает критическое, гипотезу о независимости
факторов отвергают с выбранным уровнем доверия. В противном случае
гипотеза не отвергается (что, разумеется, не означает её безусловной
истинности: быть может, этот результат случаен).
Расчёты по проверке независимости факторов рекомендуется вы-
полнять в таблице, строки которой (кроме итоговой) соответствуют ком-
бинациям значений двух исследуемых переменных, а столбцы — этапам
вычислений. В частности, в ней должны быть представлены величины n
ij
,
n'
ij
и (n
ij
– n'
ij
)
2
/n'
ij
.
Далее формулируют функцию вида i-го значения первой переменной, n2j — число наблюдений j-го значения
1 n второй переменной;
å Ni Fi ( x),
N k =1 ¨ расчёт значения критерия c по формуле
2
k1 k2
(nij - nij¢ ) 2
где N — число наблюдений всего, Ni — число наблюдений в совокупно- åå nij¢
,
сти i, n — число совокупностей (на одну меньше числа вершин). i =1 j =1
Затем выдвигается гипотеза, что исследуемая случайная величина где k1 — число значений первой переменной; k2 — число значений второй
имеет данную функцию распределения. Затем она проверяется в обычном переменной; nij — фактическое число наблюдений, при которых первая
порядке по критерию c , только для определения теоретических частот
2
переменная принимала значение i, а вторая — значение j; остальные обо-
вместо обычной F(x), соответствующей одному из известных распределе- значения прежние;
ний, используется данная функция, а при расчёте числа степеней свободы ¨ определение критического уровня c для заданной доверительной
2
учитывается общее количество параметров, определённых на основе эмпи- вероятности и числа степеней свободы (k1–1)·(k2–1) — например, с помо-
рического распределения для всех Fi(x).
щью формулы Excel
=ХИ2ОБР(1-УровеньДоверия;(_k1-1)*(_k2-1)),
4. Проверка независимости факторов с помощью
критерия c2 где в ячейке УровеньДоверия содержится требуемая доверительная ве-
роятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2
Критерий c2 очень удобен для проверки независимости двух дис- — число значений соответствующих дискретных переменных. В MathCad
кретных переменных. Если имеется набор наблюдений, в каждом из кото- аналогичный расчёт выполняется с помощью формулы
рых зафиксировано значение двух дискретных переменных, такой, что ка-
qchisq(1-УровеньДоверия;(k1-1)*(k2-1));
ждой паре значений дискретных переменных теоретическая частота, со-
¨ сравнение фактического и критического значений c и заключе-
2
ставляющая не менее 6-8 наблюдений, то с помощью данного критерия
можно, не привлекая никаких других теоретических соображений, сделать ние о том, следует ли отвергнуть предложенную теоретическую модель
заключение о том, проявляется ли какая-либо зависимость между этими распределения случайной величины.
Если значение c превышает критическое, гипотезу о независимости
2
переменными в имеющихся результатах наблюдений.
При достаточной численности наблюдений данный критерий наи- факторов отвергают с выбранным уровнем доверия. В противном случае
лучшим образом соответствует целям практического задания к теме 3 при гипотеза не отвергается (что, разумеется, не означает её безусловной
проверке независимости переменных. Если гипотеза о независимости двух истинности: быть может, этот результат случаен).
факторов отвергается, один из них должен быть исключён из модели и за- Расчёты по проверке независимости факторов рекомендуется вы-
менён другим. Если гипотеза о независимости результата от фактора не полнять в таблице, строки которой (кроме итоговой) соответствуют ком-
отвергается, фактор также следует исключить из модели, заменив его дру- бинациям значений двух исследуемых переменных, а столбцы — этапам
гим. вычислений. В частности, в ней должны быть представлены величины nij,
Процедура проверки предполагает следующие этапы: n'ij и (nij – n'ij)2/n'ij.
¨ подсчёт числа наблюдений, для каждого сочетания значений двух
переменных;
¨ подсчёт теоретической частоты n'ij для каждого сочетания значе-
ний двух переменных, составляющей n1i·n2j/N, где n1i — число наблюдений
65 66
Страницы
- « первая
- ‹ предыдущая
- …
- 31
- 32
- 33
- 34
- 35
- …
- следующая ›
- последняя »
