Практикум по теории систем и системному анализу. Светлов Н.М. - 31 стр.

UptoLike

Составители: 

61
была не менее 95%, при остром недостатке данныхне менее 90%
1
) не
могли бы возникнуть, если бы распределение случайной величины соот-
ветствовало предполагаемому закону, гипотезу о согласии эмпириче-
ского распределения с выбранным теоретическим отвергают.
В противном случае считают, что расхождение с предлагаемой тео-
ретической моделью не доказано с достаточной степенью надёжности; а
значит, нет оснований ставить под сомнение те теоретические соображе-
ния, на основе которых выдвинута гипотеза о законе распределенияпо
крайней мере, до тех пор, пока новые, более полные, данные не придут в
противоречие с нею.
Выдвигая гипотезу о распределении, принимают во внимание сле-
дующие сведения (в меру их доступности):
¨ область определения случайной величины;
¨ происхождение данной случайной величины;
¨ моменты распределения и их соотношение;
¨ форму гистограммы;
¨ результаты моделирования данной случайной величины, полу-
ченные другими исследователями;
¨ аналогии с другими случайными величинами, распределение ко-
торых установлено;
¨ численность наблюдений.
В качестве области определения случайной величины не следует
принимать наблюдаемый диапазон вариации (иначе у нас никогда не ока-
залось бы оснований для использования нормального распределения). Её
определяют исходя из сущности процесса или явления, отражаемого слу-
чайной величиной. Например, урожайность культуры не может быть ниже
нуля; существует также её объективный верхний предел, зависящий от
массы гумуса в почве. Поэтому для её моделирования может подойти ка-
кое-либо распределение, определённое на интервале [0; b] например,
бета или (при недостатке данных) треугольное. При этом величину b, раз
она неизвестна, можно определить подбором, добиваясь наилучшего согла-
сия опытных данных с теоретическим распределением.
Можно ли использовать для моделирования урожайности, напри-
мер, гамма-распределение? Очевидно, что в действительности урожайность
не может соответствовать этому распределению, так как она в принципе
не может быть сколь угодно большой. Но с некоторой степенью грубости
1
В последнем случае результаты обычно требуют перепроверки с привлечени-
ем новых наблюдений.
62
гамма-распределение может оказаться практически приемлемой моделью,
если оценённая по гамма-распределению (то есть теоретическая) вероят-
ность значений урожайности, превышающих фактически наблюдаемые,
пренебрежимо мала. То же касается нормального распределения, но тогда
пренебрежимо мала должна быть также теоретическая вероятность отри-
цательных значений урожайности. Последнее часто не выполняется.
Если, кроме наблюдений, нет никаких оснований для выбора рас-
пределения, то следует отдавать предпочтение самым простым распреде-
лениям с наименьшим числом параметров. Если к тому же наблюдения
малочисленны, лучше пользоваться такими распределениями, как равно-
мерное и треугольное. Результаты, полученные при подобных обстоятель-
ствах, требуют перепроверки в дальнейшем.
Параметры гипотетических распределений, если только они не из-
вестны заранее из теоретических соображений, определяют, когда воз-
можно, на основе моментов эмпирического распределения (средней и дис-
персии)
1
, а когда невозможноподбором.
После того, как гипотеза сформулирована, можно приступать к её
проверке. Процедура проверки по критерию
c
2
предполагает следующие
этапы:
¨ разбиение интервала вариации на непересекающиеся классы;
¨ определение численности наблюдений эмпирического распреде-
ления, приходящихся на каждый класс;
¨ определение теоретической численности наблюдений в соответ-
ствии с выбранной моделью случайной величины;
¨ расчёт значения критерия
c
2
;
¨ определение критического уровня
c
2
для заданной доверительной
вероятности;
¨ сравнение фактического и критического значений
c
2
и заключе-
ние о том, следует ли отвергнуть предложенную теоретическую модель
распределения случайной величины.
Рассмотрим каждый из этих этапов.
Считается, что практически приемлемый компромисс между чис-
ленностью классов и численностью наблюдений в каждом классе достига-
ется, если число классов определять по формуле
,
N
где Nчисло на-
блюдений, а ширину классов принимают равной. Чтобы обеспечить прием-
лемую вероятность ошибки при расчёте значения
c
2
, необходимо следить
1
См. формулы для определения значений параметров распределений при из-
вестных средней и дисперсии в Приложении 1.
была не менее 95%, при остром недостатке данных — не менее 90%1) не               гамма-распределение может оказаться практически приемлемой моделью,
могли бы возникнуть, если бы распределение случайной величины соот-               если оценённая по гамма-распределению (то есть теоретическая) вероят-
ветствовало предполагаемому закону, — гипотезу о согласии эмпириче-               ность значений урожайности, превышающих фактически наблюдаемые,
ского распределения с выбранным теоретическим отвергают.                          пренебрежимо мала. То же касается нормального распределения, но тогда
       В противном случае считают, что расхождение с предлагаемой тео-            пренебрежимо мала должна быть также теоретическая вероятность отри-
ретической моделью не доказано с достаточной степенью надёжности; а               цательных значений урожайности. Последнее часто не выполняется.
значит, нет оснований ставить под сомнение те теоретические соображе-                    Если, кроме наблюдений, нет никаких оснований для выбора рас-
ния, на основе которых выдвинута гипотеза о законе распределения — по             пределения, то следует отдавать предпочтение самым простым распреде-
крайней мере, до тех пор, пока новые, более полные, данные не придут в            лениям с наименьшим числом параметров. Если к тому же наблюдения
противоречие с нею.                                                               малочисленны, лучше пользоваться такими распределениями, как равно-
       Выдвигая гипотезу о распределении, принимают во внимание сле-              мерное и треугольное. Результаты, полученные при подобных обстоятель-
дующие сведения (в меру их доступности):                                          ствах, требуют перепроверки в дальнейшем.
       ¨ область определения случайной величины;                                         Параметры гипотетических распределений, если только они не из-
       ¨ происхождение данной случайной величины;                                 вестны заранее из теоретических соображений, определяют, когда воз-
       ¨ моменты распределения и их соотношение;                                  можно, на основе моментов эмпирического распределения (средней и дис-
       ¨ форму гистограммы;                                                       персии)1, а когда невозможно — подбором.
       ¨ результаты моделирования данной случайной величины, полу-                       После того, как гипотеза сформулирована, можно приступать к её
                                                                                  проверке. Процедура проверки по критерию c предполагает следующие
                                                                                                                               2
ченные другими исследователями;
       ¨ аналогии с другими случайными величинами, распределение ко-              этапы:
торых установлено;                                                                       ¨ разбиение интервала вариации на непересекающиеся классы;
       ¨ численность наблюдений.                                                         ¨ определение численности наблюдений эмпирического распреде-
       В качестве области определения случайной величины не следует               ления, приходящихся на каждый класс;
принимать наблюдаемый диапазон вариации (иначе у нас никогда не ока-                     ¨ определение теоретической численности наблюдений в соответ-
залось бы оснований для использования нормального распределения). Её              ствии с выбранной моделью случайной величины;
                                                                                         ¨ расчёт значения критерия c ;
                                                                                                                     2
определяют исходя из сущности процесса или явления, отражаемого слу-
                                                                                         ¨ определение критического уровня c для заданной доверительной
                                                                                                                            2
чайной величиной. Например, урожайность культуры не может быть ниже
нуля; существует также её объективный верхний предел, зависящий от                вероятности;
                                                                                         ¨ сравнение фактического и критического значений c и заключе-
                                                                                                                                            2
массы гумуса в почве. Поэтому для её моделирования может подойти ка-
кое-либо распределение, определённое на интервале [0; b] — например,              ние о том, следует ли отвергнуть предложенную теоретическую модель
бета или (при недостатке данных) треугольное. При этом величину b, раз            распределения случайной величины.
она неизвестна, можно определить подбором, добиваясь наилучшего согла-                   Рассмотрим каждый из этих этапов.
сия опытных данных с теоретическим распределением.                                       Считается, что практически приемлемый компромисс между чис-
       Можно ли использовать для моделирования урожайности, напри-                ленностью классов и численностью наблюдений в каждом классе достига-
мер, гамма-распределение? Очевидно, что в действительности урожайность            ется, если число классов определять по формуле N , где N — число на-
не может соответствовать этому распределению, так как она в принципе              блюдений, а ширину классов принимают равной. Чтобы обеспечить прием-
не может быть сколь угодно большой. Но с некоторой степенью грубости              лемую вероятность ошибки при расчёте значения c2, необходимо следить

      1                                                                                 1
        В последнем случае результаты обычно требуют перепроверки с привлечени-            См. формулы для определения значений параметров распределений при из-
ем новых наблюдений.                                                              вестных средней и дисперсии в Приложении 1.

                                                                            61    62