ВУЗ:
Составители:
Рубрика:
61
была не менее 95%, при остром недостатке данных — не менее 90%
1
) не
могли бы возникнуть, если бы распределение случайной величины соот-
ветствовало предполагаемому закону, — гипотезу о согласии эмпириче-
ского распределения с выбранным теоретическим отвергают.
В противном случае считают, что расхождение с предлагаемой тео-
ретической моделью не доказано с достаточной степенью надёжности; а
значит, нет оснований ставить под сомнение те теоретические соображе-
ния, на основе которых выдвинута гипотеза о законе распределения — по
крайней мере, до тех пор, пока новые, более полные, данные не придут в
противоречие с нею.
Выдвигая гипотезу о распределении, принимают во внимание сле-
дующие сведения (в меру их доступности):
¨ область определения случайной величины;
¨ происхождение данной случайной величины;
¨ моменты распределения и их соотношение;
¨ форму гистограммы;
¨ результаты моделирования данной случайной величины, полу-
ченные другими исследователями;
¨ аналогии с другими случайными величинами, распределение ко-
торых установлено;
¨ численность наблюдений.
В качестве области определения случайной величины не следует
принимать наблюдаемый диапазон вариации (иначе у нас никогда не ока-
залось бы оснований для использования нормального распределения). Её
определяют исходя из сущности процесса или явления, отражаемого слу-
чайной величиной. Например, урожайность культуры не может быть ниже
нуля; существует также её объективный верхний предел, зависящий от
массы гумуса в почве. Поэтому для её моделирования может подойти ка-
кое-либо распределение, определённое на интервале [0; b] — например,
бета или (при недостатке данных) треугольное. При этом величину b, раз
она неизвестна, можно определить подбором, добиваясь наилучшего согла-
сия опытных данных с теоретическим распределением.
Можно ли использовать для моделирования урожайности, напри-
мер, гамма-распределение? Очевидно, что в действительности урожайность
не может соответствовать этому распределению, так как она в принципе
не может быть сколь угодно большой. Но с некоторой степенью грубости
1
В последнем случае результаты обычно требуют перепроверки с привлечени-
ем новых наблюдений.
62
гамма-распределение может оказаться практически приемлемой моделью,
если оценённая по гамма-распределению (то есть теоретическая) вероят-
ность значений урожайности, превышающих фактически наблюдаемые,
пренебрежимо мала. То же касается нормального распределения, но тогда
пренебрежимо мала должна быть также теоретическая вероятность отри-
цательных значений урожайности. Последнее часто не выполняется.
Если, кроме наблюдений, нет никаких оснований для выбора рас-
пределения, то следует отдавать предпочтение самым простым распреде-
лениям с наименьшим числом параметров. Если к тому же наблюдения
малочисленны, лучше пользоваться такими распределениями, как равно-
мерное и треугольное. Результаты, полученные при подобных обстоятель-
ствах, требуют перепроверки в дальнейшем.
Параметры гипотетических распределений, если только они не из-
вестны заранее из теоретических соображений, определяют, когда воз-
можно, на основе моментов эмпирического распределения (средней и дис-
персии)
1
, а когда невозможно — подбором.
После того, как гипотеза сформулирована, можно приступать к её
проверке. Процедура проверки по критерию
c
2
предполагает следующие
этапы:
¨ разбиение интервала вариации на непересекающиеся классы;
¨ определение численности наблюдений эмпирического распреде-
ления, приходящихся на каждый класс;
¨ определение теоретической численности наблюдений в соответ-
ствии с выбранной моделью случайной величины;
¨ расчёт значения критерия
c
2
;
¨ определение критического уровня
c
2
для заданной доверительной
вероятности;
¨ сравнение фактического и критического значений
c
2
и заключе-
ние о том, следует ли отвергнуть предложенную теоретическую модель
распределения случайной величины.
Рассмотрим каждый из этих этапов.
Считается, что практически приемлемый компромисс между чис-
ленностью классов и численностью наблюдений в каждом классе достига-
ется, если число классов определять по формуле
,
N
где N — число на-
блюдений, а ширину классов принимают равной. Чтобы обеспечить прием-
лемую вероятность ошибки при расчёте значения
c
2
, необходимо следить
1
См. формулы для определения значений параметров распределений при из-
вестных средней и дисперсии в Приложении 1.
была не менее 95%, при остром недостатке данных — не менее 90%1) не гамма-распределение может оказаться практически приемлемой моделью, могли бы возникнуть, если бы распределение случайной величины соот- если оценённая по гамма-распределению (то есть теоретическая) вероят- ветствовало предполагаемому закону, — гипотезу о согласии эмпириче- ность значений урожайности, превышающих фактически наблюдаемые, ского распределения с выбранным теоретическим отвергают. пренебрежимо мала. То же касается нормального распределения, но тогда В противном случае считают, что расхождение с предлагаемой тео- пренебрежимо мала должна быть также теоретическая вероятность отри- ретической моделью не доказано с достаточной степенью надёжности; а цательных значений урожайности. Последнее часто не выполняется. значит, нет оснований ставить под сомнение те теоретические соображе- Если, кроме наблюдений, нет никаких оснований для выбора рас- ния, на основе которых выдвинута гипотеза о законе распределения — по пределения, то следует отдавать предпочтение самым простым распреде- крайней мере, до тех пор, пока новые, более полные, данные не придут в лениям с наименьшим числом параметров. Если к тому же наблюдения противоречие с нею. малочисленны, лучше пользоваться такими распределениями, как равно- Выдвигая гипотезу о распределении, принимают во внимание сле- мерное и треугольное. Результаты, полученные при подобных обстоятель- дующие сведения (в меру их доступности): ствах, требуют перепроверки в дальнейшем. ¨ область определения случайной величины; Параметры гипотетических распределений, если только они не из- ¨ происхождение данной случайной величины; вестны заранее из теоретических соображений, определяют, когда воз- ¨ моменты распределения и их соотношение; можно, на основе моментов эмпирического распределения (средней и дис- ¨ форму гистограммы; персии)1, а когда невозможно — подбором. ¨ результаты моделирования данной случайной величины, полу- После того, как гипотеза сформулирована, можно приступать к её проверке. Процедура проверки по критерию c предполагает следующие 2 ченные другими исследователями; ¨ аналогии с другими случайными величинами, распределение ко- этапы: торых установлено; ¨ разбиение интервала вариации на непересекающиеся классы; ¨ численность наблюдений. ¨ определение численности наблюдений эмпирического распреде- В качестве области определения случайной величины не следует ления, приходящихся на каждый класс; принимать наблюдаемый диапазон вариации (иначе у нас никогда не ока- ¨ определение теоретической численности наблюдений в соответ- залось бы оснований для использования нормального распределения). Её ствии с выбранной моделью случайной величины; ¨ расчёт значения критерия c ; 2 определяют исходя из сущности процесса или явления, отражаемого слу- ¨ определение критического уровня c для заданной доверительной 2 чайной величиной. Например, урожайность культуры не может быть ниже нуля; существует также её объективный верхний предел, зависящий от вероятности; ¨ сравнение фактического и критического значений c и заключе- 2 массы гумуса в почве. Поэтому для её моделирования может подойти ка- кое-либо распределение, определённое на интервале [0; b] — например, ние о том, следует ли отвергнуть предложенную теоретическую модель бета или (при недостатке данных) треугольное. При этом величину b, раз распределения случайной величины. она неизвестна, можно определить подбором, добиваясь наилучшего согла- Рассмотрим каждый из этих этапов. сия опытных данных с теоретическим распределением. Считается, что практически приемлемый компромисс между чис- Можно ли использовать для моделирования урожайности, напри- ленностью классов и численностью наблюдений в каждом классе достига- мер, гамма-распределение? Очевидно, что в действительности урожайность ется, если число классов определять по формуле N , где N — число на- не может соответствовать этому распределению, так как она в принципе блюдений, а ширину классов принимают равной. Чтобы обеспечить прием- не может быть сколь угодно большой. Но с некоторой степенью грубости лемую вероятность ошибки при расчёте значения c2, необходимо следить 1 1 В последнем случае результаты обычно требуют перепроверки с привлечени- См. формулы для определения значений параметров распределений при из- ем новых наблюдений. вестных средней и дисперсии в Приложении 1. 61 62
Страницы
- « первая
- ‹ предыдущая
- …
- 29
- 30
- 31
- 32
- 33
- …
- следующая ›
- последняя »