Практикум по теории систем и системному анализу. Светлов Н.М. - 13 стр.

UptoLike

Составители: 

25
ТЕМА 3. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ О
СТРУКТУРЕ СИСТЕМЫ В ФОРМЕ УСЛОВНЫХ
ВЕРОЯТНОСТЕЙ. ПРОВЕРКА СУЩЕСТВЕННОСТИ
И НЕЗАВИСИМОСТИ ПЕРЕМЕННЫХ
Теоретическая часть
Проверка существенности и независимости переменных
Входные переменные подсистем изучаемой производственной сис-
темы должны обладать свойствами независимости и существенности.
Свойство независимости состоит в том, что все входные перемен-
ные должны быть взаимно независимы либо связь между ними должна
быть достаточно слабой, чтобы её можно было игнорировать.
Свойство существенности в том, что выходная переменная
должна зависеть от каждой из входных, причём после получения инфор-
мации о значениях всех входных переменных энтропия выходной перемен-
ной должна быть как можно меньше.
О наличии этих свойств у переменных, включённых в модель, судят
на основе статистических показателей тесноты связей, проверки статисти-
ческих гипотез о независимости переменных, доли энтропии (относитель-
ной информативности) переменной, снимаемой информацией о значении
другой переменной. Выбирая методы оценки тесноты связи, следует учи-
тывать особенности их содержания. В частности:
¨ критерий χ
2
может быть использован применительно к дискрет-
ным переменным для проверки гипотез о независимости двух дискретных
переменных на основании имеющихся наблюдений (см. Приложение 4), а
также о том, не противоречит ли предполагаемая форма связи между пе-
ременными имеющимся данным;
¨ однофакторный дисперсионный анализ имеет целью проверку ги-
потезы о существовании статистически достоверной зависимости непре-
рывной нормально распределённой переменной
1
от дискретной (или приве-
дённой к дискретной форме) переменной (см. Приложение 5);
1
При гамма-распределении результаты оценки тесноты связи при посредстве
дисперсионного анализа содержат ошибку, величина которой, однако, для большинства
практических приложений не слишком велика.
26
¨ метод относительной информативности (см. Приложение 6) по-
зволяет определить, какая доля энтропии одной дискретной переменной
снимается другой дискретной переменной. Проверку тесноты связи по
этому методу делают после построения таблиц условных вероятностей
(см. ниже);
¨ корреляционный анализ оценивает тесноту связи между пере-
менными непрерывными при условии, что связь между ними предполагает-
ся линейной. Если величина
2
21,
rNr
-- где Nчисло наблюдений,
а rкоэффициент парной корреляции по Пирсону, оказывается за преде-
лами соответствующего выбранному уровню доверия квантиля распреде-
ления Стьюдента для числа степеней свободы N2, гипотеза о независи-
мости переменных отвергается
1
. Соответствующие вычисления можно вы-
полнить по формуле Excel
=СТЬЮДРАСП(ABS(КоэфКор)/КОРЕНЬ(1-КоэфКор^2)*
КОРЕНЬ(СЧЁТ(Ряд1)-2);СЧЁТ(Ряд1)-2;2).
Здесь КоэфКор имя ячейки, содержащей коэффициент парной корреля-
ции по Пирсону, вычисляемый по формуле
=ПИРСОН(Ряд1;Ряд2),
Ряд1 и Ряд2имена диапазонов ячеек, содержащих наблюдаемые зна-
чения переменных, связь между которыми исследуется. В обоих рядах
должно быть одинаковое количество ячеек, нечисловых значений и пустых
ячеек быть не должно. В программе MathCad соответстствующие вычис-
ления выглядят следующим образом:
,
æö
×
=
ç÷
ç÷
èø
2
corr(Ряд1;Ряд2)length(Ряд1)-2
dt;length(Ряд1)-2
1-corr(Ряд1;Ряд2)
1
Если наблюдений больше 30 можно использовать нормальное распределе-
ние, которое является пределом распределения Стьюдента при бесконечном числе на-
блюдений.
                                                                                           ¨ метод относительной информативности (см. Приложение 6) по-
        ТЕМА 3. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ О                                              зволяет определить, какая доля энтропии одной дискретной переменной
     СТРУКТУРЕ СИСТЕМЫ В ФОРМЕ УСЛОВНЫХ                                             снимается другой дискретной переменной. Проверку тесноты связи по
    ВЕРОЯТНОСТЕЙ. ПРОВЕРКА СУЩЕСТВЕННОСТИ                                           этому методу делают после построения таблиц условных вероятностей
         И НЕЗАВИСИМОСТИ ПЕРЕМЕННЫХ                                                 (см. ниже);
                                                                                           ¨ корреляционный анализ оценивает тесноту связи между пере-
                                                                                    менными непрерывными при условии, что связь между ними предполагает-
                          Теоретическая часть
                                                                                    ся линейной. Если величина r N - 2 1 - r 2 , где N — число наблюдений,
                                                                                    а r — коэффициент парной корреляции по Пирсону, оказывается за преде-
       Проверка существенности и независимости переменных
                                                                                    лами соответствующего выбранному уровню доверия квантиля распреде-
      Входные переменные подсистем изучаемой производственной сис-                  ления Стьюдента для числа степеней свободы N–2, гипотеза о независи-
темы должны обладать свойствами независимости и существенности.                     мости переменных отвергается1. Соответствующие вычисления можно вы-
      Свойство независимости состоит в том, что все входные перемен-                полнить по формуле Excel
ные должны быть взаимно независимы либо связь между ними должна
быть достаточно слабой, чтобы её можно было игнорировать.                                    =СТЬЮДРАСП(ABS(КоэфКор)/КОРЕНЬ(1-КоэфКор^2)*
      Свойство существенности — в том, что выходная переменная
должна зависеть от каждой из входных, причём после получения инфор-                               КОРЕНЬ(СЧЁТ(Ряд1)-2);СЧЁТ(Ряд1)-2;2).
мации о значениях всех входных переменных энтропия выходной перемен-
ной должна быть как можно меньше.                                                   Здесь КоэфКор — имя ячейки, содержащей коэффициент парной корреля-
      О наличии этих свойств у переменных, включённых в модель, судят               ции по Пирсону, вычисляемый по формуле
на основе статистических показателей тесноты связей, проверки статисти-
ческих гипотез о независимости переменных, доли энтропии (относитель-                                          =ПИРСОН(Ряд1;Ряд2),
ной информативности) переменной, снимаемой информацией о значении
другой переменной. Выбирая методы оценки тесноты связи, следует учи-                Ряд1 и Ряд2 — имена диапазонов ячеек, содержащих наблюдаемые зна-
тывать особенности их содержания. В частности:
                   2                                                                чения переменных, связь между которыми исследуется. В обоих рядах
      ¨ критерий χ может быть использован применительно к дискрет-
ным переменным для проверки гипотез о независимости двух дискретных                 должно быть одинаковое количество ячеек, нечисловых значений и пустых
переменных на основании имеющихся наблюдений (см. Приложение 4), а                  ячеек быть не должно. В программе MathCad соответстствующие вычис-
также о том, не противоречит ли предполагаемая форма связи между пе-
                                                                                    ления выглядят следующим образом:
ременными имеющимся данным;
      ¨ однофакторный дисперсионный анализ имеет целью проверку ги-                          æ corr(Ряд1;Ряд2)× length(Ряд1)-2                ö
потезы о существовании статистически достоверной зависимости непре-                      = dtç                                 ;length(Ряд1)-2÷ ,
                                                                                             ç        1-corr(Ряд1;Ряд2)2                      ÷
рывной нормально распределённой переменной1 от дискретной (или приве-                        è                                                ø
дённой к дискретной форме) переменной (см. Приложение 5);


       1                                                                                   1
         При гамма-распределении результаты оценки тесноты связи при посредстве               Если наблюдений больше 30 — можно использовать нормальное распределе-
дисперсионного анализа содержат ошибку, величина которой, однако, для большинства   ние, которое является пределом распределения Стьюдента при бесконечном числе на-
практических приложений не слишком велика.                                          блюдений.

                                                                              25    26