ВУЗ:
Составители:
Рубрика:
65
Далее формулируют функцию вида
1
1
(),
n
ii
k
NFx
N
=
å
где N — число наблюдений всего, N
i
— число наблюдений в совокупно-
сти i, n — число совокупностей (на одну меньше числа вершин).
Затем выдвигается гипотеза, что исследуемая случайная величина
имеет данную функцию распределения. Затем она проверяется в обычном
порядке по критерию
c
2
, только для определения теоретических частот
вместо обычной F(x), соответствующей одному из известных распределе-
ний, используется данная функция, а при расчёте числа степеней свободы
учитывается общее количество параметров, определённых на основе эмпи-
рического распределения для всех F
i
(x).
4. Проверка независимости факторов с помощью
критерия
c
2
Критерий
c
2
очень удобен для проверки независимости двух дис-
кретных переменных. Если имеется набор наблюдений, в каждом из кото-
рых зафиксировано значение двух дискретных переменных, такой, что ка-
ждой паре значений дискретных переменных теоретическая частота, со-
ставляющая не менее 6-8 наблюдений, то с помощью данного критерия
можно, не привлекая никаких других теоретических соображений, сделать
заключение о том, проявляется ли какая-либо зависимость между этими
переменными в имеющихся результатах наблюдений.
При достаточной численности наблюдений данный критерий наи-
лучшим образом соответствует целям практического задания к теме 3 при
проверке независимости переменных. Если гипотеза о независимости двух
факторов отвергается, один из них должен быть исключён из модели и за-
менён другим. Если гипотеза о независимости результата от фактора не
отвергается, фактор также следует исключить из модели, заменив его дру-
гим.
Процедура проверки предполагает следующие этапы:
¨ подсчёт числа наблюдений, для каждого сочетания значений двух
переменных;
¨ подсчёт теоретической частоты n'
ij
для каждого сочетания значе-
ний двух переменных, составляющей n
1i
·n
2j
/N, где n
1i
— число наблюдений
66
i-го значения первой переменной, n
2j
— число наблюдений j-го значения
второй переменной;
¨ расчёт значения критерия
c
2
по формуле
12
2
11
()
,
kk
ijij
ij
ij
nn
n
==
¢
-
¢
åå
где k
1
— число значений первой переменной; k
2
— число значений второй
переменной; n
ij
— фактическое число наблюдений, при которых первая
переменная принимала значение i, а вторая — значение j; остальные обо-
значения прежние;
¨ определение критического уровня
c
2
для заданной доверительной
вероятности и числа степеней свободы (k
1
–1)·(k
2
–1) — например, с помо-
щью формулы Excel
=ХИ2ОБР(1-УровеньДоверия;(_k1-1)*(_k2-1)),
где в ячейке УровеньДоверия содержится требуемая доверительная ве-
роятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2
— число значений соответствующих дискретных переменных. В MathCad
аналогичный расчёт выполняется с помощью формулы
qchisq(1-УровеньДоверия;(k1-1)*(k2-1));
¨ сравнение фактического и критического значений
c
2
и заключе-
ние о том, следует ли отвергнуть предложенную теоретическую модель
распределения случайной величины.
Если значение
c
2
превышает критическое, гипотезу о независимости
факторов отвергают с выбранным уровнем доверия. В противном случае
гипотеза не отвергается (что, разумеется, не означает её безусловной
истинности: быть может, этот результат случаен).
Расчёты по проверке независимости факторов рекомендуется вы-
полнять в таблице, строки которой (кроме итоговой) соответствуют ком-
бинациям значений двух исследуемых переменных, а столбцы — этапам
вычислений. В частности, в ней должны быть представлены величины n
ij
,
n'
ij
и (n
ij
– n'
ij
)
2
/n'
ij
.
Далее формулируют функцию вида i-го значения первой переменной, n2j — число наблюдений j-го значения 1 n второй переменной; å Ni Fi ( x), N k =1 ¨ расчёт значения критерия c по формуле 2 k1 k2 (nij - nij¢ ) 2 где N — число наблюдений всего, Ni — число наблюдений в совокупно- åå nij¢ , сти i, n — число совокупностей (на одну меньше числа вершин). i =1 j =1 Затем выдвигается гипотеза, что исследуемая случайная величина где k1 — число значений первой переменной; k2 — число значений второй имеет данную функцию распределения. Затем она проверяется в обычном переменной; nij — фактическое число наблюдений, при которых первая порядке по критерию c , только для определения теоретических частот 2 переменная принимала значение i, а вторая — значение j; остальные обо- вместо обычной F(x), соответствующей одному из известных распределе- значения прежние; ний, используется данная функция, а при расчёте числа степеней свободы ¨ определение критического уровня c для заданной доверительной 2 учитывается общее количество параметров, определённых на основе эмпи- вероятности и числа степеней свободы (k1–1)·(k2–1) — например, с помо- рического распределения для всех Fi(x). щью формулы Excel =ХИ2ОБР(1-УровеньДоверия;(_k1-1)*(_k2-1)), 4. Проверка независимости факторов с помощью критерия c2 где в ячейке УровеньДоверия содержится требуемая доверительная ве- роятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2 Критерий c2 очень удобен для проверки независимости двух дис- — число значений соответствующих дискретных переменных. В MathCad кретных переменных. Если имеется набор наблюдений, в каждом из кото- аналогичный расчёт выполняется с помощью формулы рых зафиксировано значение двух дискретных переменных, такой, что ка- qchisq(1-УровеньДоверия;(k1-1)*(k2-1)); ждой паре значений дискретных переменных теоретическая частота, со- ¨ сравнение фактического и критического значений c и заключе- 2 ставляющая не менее 6-8 наблюдений, то с помощью данного критерия можно, не привлекая никаких других теоретических соображений, сделать ние о том, следует ли отвергнуть предложенную теоретическую модель заключение о том, проявляется ли какая-либо зависимость между этими распределения случайной величины. Если значение c превышает критическое, гипотезу о независимости 2 переменными в имеющихся результатах наблюдений. При достаточной численности наблюдений данный критерий наи- факторов отвергают с выбранным уровнем доверия. В противном случае лучшим образом соответствует целям практического задания к теме 3 при гипотеза не отвергается (что, разумеется, не означает её безусловной проверке независимости переменных. Если гипотеза о независимости двух истинности: быть может, этот результат случаен). факторов отвергается, один из них должен быть исключён из модели и за- Расчёты по проверке независимости факторов рекомендуется вы- менён другим. Если гипотеза о независимости результата от фактора не полнять в таблице, строки которой (кроме итоговой) соответствуют ком- отвергается, фактор также следует исключить из модели, заменив его дру- бинациям значений двух исследуемых переменных, а столбцы — этапам гим. вычислений. В частности, в ней должны быть представлены величины nij, Процедура проверки предполагает следующие этапы: n'ij и (nij – n'ij)2/n'ij. ¨ подсчёт числа наблюдений, для каждого сочетания значений двух переменных; ¨ подсчёт теоретической частоты n'ij для каждого сочетания значе- ний двух переменных, составляющей n1i·n2j/N, где n1i — число наблюдений 65 66
Страницы
- « первая
- ‹ предыдущая
- …
- 31
- 32
- 33
- 34
- 35
- …
- следующая ›
- последняя »