Практикум по теории систем и системному анализу. Светлов Н.М. - 33 стр.

UptoLike

Составители: 

65
Далее формулируют функцию вида
1
1
(),
n
ii
k
NFx
N
=
å
где N число наблюдений всего, N
i
число наблюдений в совокупно-
сти i, nчисло совокупностей (на одну меньше числа вершин).
Затем выдвигается гипотеза, что исследуемая случайная величина
имеет данную функцию распределения. Затем она проверяется в обычном
порядке по критерию
c
2
, только для определения теоретических частот
вместо обычной F(x), соответствующей одному из известных распределе-
ний, используется данная функция, а при расчёте числа степеней свободы
учитывается общее количество параметров, определённых на основе эмпи-
рического распределения для всех F
i
(x).
4. Проверка независимости факторов с помощью
критерия
c
2
Критерий
c
2
очень удобен для проверки независимости двух дис-
кретных переменных. Если имеется набор наблюдений, в каждом из кото-
рых зафиксировано значение двух дискретных переменных, такой, что ка-
ждой паре значений дискретных переменных теоретическая частота, со-
ставляющая не менее 6-8 наблюдений, то с помощью данного критерия
можно, не привлекая никаких других теоретических соображений, сделать
заключение о том, проявляется ли какая-либо зависимость между этими
переменными в имеющихся результатах наблюдений.
При достаточной численности наблюдений данный критерий наи-
лучшим образом соответствует целям практического задания к теме 3 при
проверке независимости переменных. Если гипотеза о независимости двух
факторов отвергается, один из них должен быть исключён из модели и за-
менён другим. Если гипотеза о независимости результата от фактора не
отвергается, фактор также следует исключить из модели, заменив его дру-
гим.
Процедура проверки предполагает следующие этапы:
¨ подсчёт числа наблюдений, для каждого сочетания значений двух
переменных;
¨ подсчёт теоретической частоты n'
ij
для каждого сочетания значе-
ний двух переменных, составляющей n
1i
·n
2j
/N, где n
1i
число наблюдений
66
i-го значения первой переменной, n
2j
число наблюдений j-го значения
второй переменной;
¨ расчёт значения критерия
c
2
по формуле
12
2
11
()
,
kk
ijij
ij
ij
nn
n
==
¢
-
¢
åå
где k
1
число значений первой переменной; k
2
число значений второй
переменной; n
ij
фактическое число наблюдений, при которых первая
переменная принимала значение i, а втораязначение j; остальные обо-
значения прежние;
¨ определение критического уровня
c
2
для заданной доверительной
вероятности и числа степеней свободы (k
1
1)·(k
2
1)например, с помо-
щью формулы Excel
=ХИ2ОБР(1-УровеньДоверия;(_k1-1)*(_k2-1)),
где в ячейке УровеньДоверия содержится требуемая доверительная ве-
роятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2
число значений соответствующих дискретных переменных. В MathCad
аналогичный расчёт выполняется с помощью формулы
qchisq(1-УровеньДоверия;(k1-1)*(k2-1));
¨ сравнение фактического и критического значений
c
2
и заключе-
ние о том, следует ли отвергнуть предложенную теоретическую модель
распределения случайной величины.
Если значение
c
2
превышает критическое, гипотезу о независимости
факторов отвергают с выбранным уровнем доверия. В противном случае
гипотеза не отвергается (что, разумеется, не означает её безусловной
истинности: быть может, этот результат случаен).
Расчёты по проверке независимости факторов рекомендуется вы-
полнять в таблице, строки которой (кроме итоговой) соответствуют ком-
бинациям значений двух исследуемых переменных, а столбцы этапам
вычислений. В частности, в ней должны быть представлены величины n
ij
,
n'
ij
и (n
ij
n'
ij
)
2
/n'
ij
.
      Далее формулируют функцию вида                                      i-го значения первой переменной, n2j — число наблюдений j-го значения
                              1  n                                        второй переменной;
                                å Ni Fi ( x),
                              N k =1                                             ¨ расчёт значения критерия c по формуле
                                                                                                             2


                                                                                                        k1   k2
                                                                                                                 (nij - nij¢ ) 2
где N — число наблюдений всего, Ni — число наблюдений в совокупно-                                     åå             nij¢
                                                                                                                                 ,
сти i, n — число совокупностей (на одну меньше числа вершин).                                          i =1 j =1

        Затем выдвигается гипотеза, что исследуемая случайная величина    где k1 — число значений первой переменной; k2 — число значений второй
имеет данную функцию распределения. Затем она проверяется в обычном       переменной; nij — фактическое число наблюдений, при которых первая
порядке по критерию c , только для определения теоретических частот
                        2
                                                                          переменная принимала значение i, а вторая — значение j; остальные обо-
вместо обычной F(x), соответствующей одному из известных распределе-      значения прежние;
ний, используется данная функция, а при расчёте числа степеней свободы           ¨ определение критического уровня c для заданной доверительной
                                                                                                                    2

учитывается общее количество параметров, определённых на основе эмпи-     вероятности и числа степеней свободы (k1–1)·(k2–1) — например, с помо-
рического распределения для всех Fi(x).
                                                                          щью формулы Excel

                                                                                   =ХИ2ОБР(1-УровеньДоверия;(_k1-1)*(_k2-1)),
     4. Проверка независимости факторов с помощью
                      критерия c2                                         где в ячейке УровеньДоверия содержится требуемая доверительная ве-
                                                                          роятность (выраженная в долях, а не в процентах), в ячейках _k1 и _k2
      Критерий c2 очень удобен для проверки независимости двух дис-       — число значений соответствующих дискретных переменных. В MathCad
кретных переменных. Если имеется набор наблюдений, в каждом из кото-      аналогичный расчёт выполняется с помощью формулы
рых зафиксировано значение двух дискретных переменных, такой, что ка-
                                                                                     qchisq(1-УровеньДоверия;(k1-1)*(k2-1));
ждой паре значений дискретных переменных теоретическая частота, со-
                                                                                ¨ сравнение фактического и критического значений c и заключе-
                                                                                                                                     2
ставляющая не менее 6-8 наблюдений, то с помощью данного критерия
можно, не привлекая никаких других теоретических соображений, сделать     ние о том, следует ли отвергнуть предложенную теоретическую модель
заключение о том, проявляется ли какая-либо зависимость между этими       распределения случайной величины.
                                                                                   Если значение c превышает критическое, гипотезу о независимости
                                                                                                     2
переменными в имеющихся результатах наблюдений.
      При достаточной численности наблюдений данный критерий наи-         факторов отвергают с выбранным уровнем доверия. В противном случае
лучшим образом соответствует целям практического задания к теме 3 при     гипотеза не отвергается (что, разумеется, не означает её безусловной
проверке независимости переменных. Если гипотеза о независимости двух     истинности: быть может, этот результат случаен).
факторов отвергается, один из них должен быть исключён из модели и за-             Расчёты по проверке независимости факторов рекомендуется вы-
менён другим. Если гипотеза о независимости результата от фактора не      полнять в таблице, строки которой (кроме итоговой) соответствуют ком-
отвергается, фактор также следует исключить из модели, заменив его дру-   бинациям значений двух исследуемых переменных, а столбцы — этапам
гим.                                                                      вычислений. В частности, в ней должны быть представлены величины nij,
      Процедура проверки предполагает следующие этапы:                    n'ij и (nij – n'ij)2/n'ij.
      ¨ подсчёт числа наблюдений, для каждого сочетания значений двух
переменных;
      ¨ подсчёт теоретической частоты n'ij для каждого сочетания значе-
ний двух переменных, составляющей n1i·n2j/N, где n1i — число наблюдений



                                                                    65    66