Математические методы в библиотечной работе. Елизаров А.М - 135 стр.

UptoLike

Составители: 

Рубрика: 

1. Выборка. Начнем с обсуждения вопросов о по-
строении математической модели, достаточно верно
отражающей статистическую обработку данных экспе-
римента.
Пусть мы имеем ряд наблюдений х
1
, х
2
,...,х
к
,
которые представляют собой случайные величины.
Имеются две возможности: либо эти случайные вели-
чины распределены одинаково (имеют один и тот же
закон распределения), либо по-разному. Вторая воз-
можность выглядит более общей, однако, начав ее
моделировать, мы сразу же сталкиваемся с непреодо-
лимыми трудностями. Действительно, предположим,
что указанный ряд наблюдений получен в результате
длительного (многолетнего) исследования посещае-
мости ξ библиотеки и х
i
дают число посетителей
в один из месяцев того или иного года. Если мы
хотим спрогнозировать среднюю посещаемость (будем
описывать ее с помощью Ех
k
), то при условии отсут-
ствия связей между х
г
, ... , х
k
мы ничего не сможем
сказать о величине Ех
k
в зависимости от Ех
1
, ..., Ех
k-1
.
С другой стороны» более частная модель» когда
предполагают, что х
1
,...,х
k
распределены одинаково,
позволяет дать приближенную оценку для Ех
k
, выбрав
для этого Ех
k
(x
1
+ ... + x
k-1
)/(k — 1) = Е* ξ. Сразу
же заметим, что указанная модель может неправильно
отражать изучаемое явление. Например, из-за расши-
рения библиотеки посещаемость ир года в год могла
расти: Ех
1
< Ех
2
< ... < Ех
k-1
< Ех
k
. Но мы в качестве
Ех
k
выбрали величину Е*ξ и, тем самым, занизили прогноз
посещаемости библиотеки на будущий год. Итак, при
построении статистической модели необходимо
выбирать между общей моделью (бесполезной из-за
невозможности определить ее параметры) и частной
(которая может быть неверной и привести к не-
правильным выводам). Поэтому использование того
или иного допущения, в частности, о равнораспре-
деленности ряда наблюдений х
1
, ..., х
k
должно быть
тщательно проверено. Допустим, что х
i
одинаково
распределенные случайные величины. Но этого пред-
положения мало, чтобы делать выводы о значении Ех
k
,
ибо нам важно знать величину ошибки в приближен-
ном равенстве Ех
k
E*ξ. Для этого нужно вычислить
дисперсию величины E*ξ, т.е. D[(x
1
+ ... +x
k
_
1
)/(k
-1)]= D (х
1
+ ... + x
k-1
)/(k — 1)
2
. Однако в случае зависи-
135
    1. Выборка. Начнем с обсуждения вопросов о по-
строении математической модели, достаточно верно
отражающей статистическую обработку данных экспе-
римента.
    Пусть мы имеем ряд наблюдений х 1 , х 2 , . . . , х к ,
которые представляют собой случайные величины.
Имеются две возможности: либо эти случайные вели-
чины распределены одинаково (имеют один и тот же
закон распределения), либо по-разному. Вторая воз-
можность выглядит более общей, однако, начав ее
моделировать, мы сразу же сталкиваемся с непреодо-
лимыми трудностями. Действительно, предположим,
что указанный ряд наблюдений получен в результате
длительного (многолетнего) исследования посещае-
мости ξ библиотеки и х i дают число посетителей
в один из месяцев того или иного года. Если мы
хотим спрогнозировать среднюю посещаемость (будем
описывать ее с помощью Ехk), то при условии отсут-
ствия связей между хг, ... , хk мы ничего не сможем
сказать о величине Ехk в зависимости от Ех1, ..., Ехk-1 .
    С другой стороны» более частная модель» когда
предполагают, что х 1 ,..., х k распределены одинаково,
позволяет дать приближенную оценку для Ехk, выбрав
для этого Ехk ≈ (x1 + ... + xk-1 )/(k — 1) = Е* ξ. Сразу
же заметим, что указанная модель может неправильно
отражать изучаемое явление. Например, из-за расши-
рения библиотеки посещаемость ир года в год могла
расти: Ех 1 < Ех 2 < ... < Ех k-1 < Ех k. Но мы в качестве
Ехk выбрали величину Е*ξ и, тем самым, занизили прогноз
посещаемости библиотеки на будущий год. Итак, при
построении статистической модели необходимо
выбирать между общей моделью (бесполезной из-за
невозможности определить ее параметры) и частной
(которая может быть неверной и привести к не-
правильным выводам). Поэтому использование того
или иного допущения, в частности, о равнораспре-
деленности ряда наблюдений х1, ..., хk должно быть
тщательно проверено. Допустим, что хi — одинаково
распределенные случайные величины. Но этого пред-
положения мало, чтобы делать выводы о значении Ехk,
ибо нам важно знать величину ошибки в приближен-
ном равенстве Ехk ≈ E*ξ. Для этого нужно вычислить
дисперсию величины E*ξ, т.е.         D[(x1 + ... +xk_1)/(k —
-1)]= D (х1 + ... + xk-1)/(k — 1)2. Однако в случае зависи-
                                                         135