ВУЗ:
Составители:
Рубрика:
25
ТЕМА 3. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ О
СТРУКТУРЕ СИСТЕМЫ В ФОРМЕ УСЛОВНЫХ
ВЕРОЯТНОСТЕЙ. ПРОВЕРКА СУЩЕСТВЕННОСТИ
И НЕЗАВИСИМОСТИ ПЕРЕМЕННЫХ
Теоретическая часть
Проверка существенности и независимости переменных
Входные переменные подсистем изучаемой производственной сис-
темы должны обладать свойствами независимости и существенности.
Свойство независимости состоит в том, что все входные перемен-
ные должны быть взаимно независимы либо связь между ними должна
быть достаточно слабой, чтобы её можно было игнорировать.
Свойство существенности — в том, что выходная переменная
должна зависеть от каждой из входных, причём после получения инфор-
мации о значениях всех входных переменных энтропия выходной перемен-
ной должна быть как можно меньше.
О наличии этих свойств у переменных, включённых в модель, судят
на основе статистических показателей тесноты связей, проверки статисти-
ческих гипотез о независимости переменных, доли энтропии (относитель-
ной информативности) переменной, снимаемой информацией о значении
другой переменной. Выбирая методы оценки тесноты связи, следует учи-
тывать особенности их содержания. В частности:
¨ критерий χ
2
может быть использован применительно к дискрет-
ным переменным для проверки гипотез о независимости двух дискретных
переменных на основании имеющихся наблюдений (см. Приложение 4), а
также о том, не противоречит ли предполагаемая форма связи между пе-
ременными имеющимся данным;
¨ однофакторный дисперсионный анализ имеет целью проверку ги-
потезы о существовании статистически достоверной зависимости непре-
рывной нормально распределённой переменной
1
от дискретной (или приве-
дённой к дискретной форме) переменной (см. Приложение 5);
1
При гамма-распределении результаты оценки тесноты связи при посредстве
дисперсионного анализа содержат ошибку, величина которой, однако, для большинства
практических приложений не слишком велика.
26
¨ метод относительной информативности (см. Приложение 6) по-
зволяет определить, какая доля энтропии одной дискретной переменной
снимается другой дискретной переменной. Проверку тесноты связи по
этому методу делают после построения таблиц условных вероятностей
(см. ниже);
¨ корреляционный анализ оценивает тесноту связи между пере-
менными непрерывными при условии, что связь между ними предполагает-
ся линейной. Если величина
2
21,
rNr
-- где N — число наблюдений,
а r — коэффициент парной корреляции по Пирсону, оказывается за преде-
лами соответствующего выбранному уровню доверия квантиля распреде-
ления Стьюдента для числа степеней свободы N–2, гипотеза о независи-
мости переменных отвергается
1
. Соответствующие вычисления можно вы-
полнить по формуле Excel
=СТЬЮДРАСП(ABS(КоэфКор)/КОРЕНЬ(1-КоэфКор^2)*
КОРЕНЬ(СЧЁТ(Ряд1)-2);СЧЁТ(Ряд1)-2;2).
Здесь КоэфКор — имя ячейки, содержащей коэффициент парной корреля-
ции по Пирсону, вычисляемый по формуле
=ПИРСОН(Ряд1;Ряд2),
Ряд1 и Ряд2 — имена диапазонов ячеек, содержащих наблюдаемые зна-
чения переменных, связь между которыми исследуется. В обоих рядах
должно быть одинаковое количество ячеек, нечисловых значений и пустых
ячеек быть не должно. В программе MathCad соответстствующие вычис-
ления выглядят следующим образом:
,
æö
×
=
ç÷
ç÷
èø
2
corr(Ряд1;Ряд2)length(Ряд1)-2
dt;length(Ряд1)-2
1-corr(Ряд1;Ряд2)
1
Если наблюдений больше 30 — можно использовать нормальное распределе-
ние, которое является пределом распределения Стьюдента при бесконечном числе на-
блюдений.
¨ метод относительной информативности (см. Приложение 6) по- ТЕМА 3. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ О зволяет определить, какая доля энтропии одной дискретной переменной СТРУКТУРЕ СИСТЕМЫ В ФОРМЕ УСЛОВНЫХ снимается другой дискретной переменной. Проверку тесноты связи по ВЕРОЯТНОСТЕЙ. ПРОВЕРКА СУЩЕСТВЕННОСТИ этому методу делают после построения таблиц условных вероятностей И НЕЗАВИСИМОСТИ ПЕРЕМЕННЫХ (см. ниже); ¨ корреляционный анализ оценивает тесноту связи между пере- менными непрерывными при условии, что связь между ними предполагает- Теоретическая часть ся линейной. Если величина r N - 2 1 - r 2 , где N — число наблюдений, а r — коэффициент парной корреляции по Пирсону, оказывается за преде- Проверка существенности и независимости переменных лами соответствующего выбранному уровню доверия квантиля распреде- Входные переменные подсистем изучаемой производственной сис- ления Стьюдента для числа степеней свободы N–2, гипотеза о независи- темы должны обладать свойствами независимости и существенности. мости переменных отвергается1. Соответствующие вычисления можно вы- Свойство независимости состоит в том, что все входные перемен- полнить по формуле Excel ные должны быть взаимно независимы либо связь между ними должна быть достаточно слабой, чтобы её можно было игнорировать. =СТЬЮДРАСП(ABS(КоэфКор)/КОРЕНЬ(1-КоэфКор^2)* Свойство существенности — в том, что выходная переменная должна зависеть от каждой из входных, причём после получения инфор- КОРЕНЬ(СЧЁТ(Ряд1)-2);СЧЁТ(Ряд1)-2;2). мации о значениях всех входных переменных энтропия выходной перемен- ной должна быть как можно меньше. Здесь КоэфКор — имя ячейки, содержащей коэффициент парной корреля- О наличии этих свойств у переменных, включённых в модель, судят ции по Пирсону, вычисляемый по формуле на основе статистических показателей тесноты связей, проверки статисти- ческих гипотез о независимости переменных, доли энтропии (относитель- =ПИРСОН(Ряд1;Ряд2), ной информативности) переменной, снимаемой информацией о значении другой переменной. Выбирая методы оценки тесноты связи, следует учи- Ряд1 и Ряд2 — имена диапазонов ячеек, содержащих наблюдаемые зна- тывать особенности их содержания. В частности: 2 чения переменных, связь между которыми исследуется. В обоих рядах ¨ критерий χ может быть использован применительно к дискрет- ным переменным для проверки гипотез о независимости двух дискретных должно быть одинаковое количество ячеек, нечисловых значений и пустых переменных на основании имеющихся наблюдений (см. Приложение 4), а ячеек быть не должно. В программе MathCad соответстствующие вычис- также о том, не противоречит ли предполагаемая форма связи между пе- ления выглядят следующим образом: ременными имеющимся данным; ¨ однофакторный дисперсионный анализ имеет целью проверку ги- æ corr(Ряд1;Ряд2)× length(Ряд1)-2 ö потезы о существовании статистически достоверной зависимости непре- = dtç ;length(Ряд1)-2÷ , ç 1-corr(Ряд1;Ряд2)2 ÷ рывной нормально распределённой переменной1 от дискретной (или приве- è ø дённой к дискретной форме) переменной (см. Приложение 5); 1 1 При гамма-распределении результаты оценки тесноты связи при посредстве Если наблюдений больше 30 — можно использовать нормальное распределе- дисперсионного анализа содержат ошибку, величина которой, однако, для большинства ние, которое является пределом распределения Стьюдента при бесконечном числе на- практических приложений не слишком велика. блюдений. 25 26
Страницы
- « первая
- ‹ предыдущая
- …
- 11
- 12
- 13
- 14
- 15
- …
- следующая ›
- последняя »