Анализ периодических компонент интенсивности точечных процессов. Любушин А.А. - 11 стр.

UptoLike

Составители: 

11
В нашем случае и, следовательно, удвоенная величина (36) имеет
асимптотическую плотность распределения
2=m
2
2
χ
, равную , а сама величина (36)
распределена асимптотически с экспоненциальной плотностью
/2
/2
x
e
x
e или
Pr{ ( ) } 1 ,
<
=−
x
RxeN
ω
(39)
при условии, что анализируемая последовательность моментов времени распределена
согласно пуассоновскому закону с постоянной интенсивностью.
Недостатком этого подхода является его асимптотический характер. Следовательно,
область его применимости ограничивается в основном «статическими» оценками, когда
периодические компоненты ищутся с использованием информации от всей выборки и эта
выборка содержит «достаточно большое» число событий. Если же вычисляется
«динамическая» оценка в скользящем временном окне, то число событий варьируется от
окна к окну и может достигать лишь нескольких десятков, что ставит вопрос о
применимости формулы (39). В этом случае более надежным является подход, основанный
на статистическом моделировании. Именно, вычисляется оценка средней интенсивности
точечного процесса по формуле
0
ˆ
/
=
NT
μ
и генерируется длинная выборка моментов
времени, интервалы между которыми распределены по закону Пуассона с интенсивностью
0
ˆ
μ
. Согласно формуле (23) для этого последовательно вызывается датчик псевдослучайных
чисел
ξ
, равномерно распределенных на и для каждого значения [0,1]
j
ξ
находится длина
интервала до следующего события по формуле:
Δ
j
t
010
ˆ
ln(1 ) / , , 0
Δ= = +Δ =
jjjjj
ttttt
μ
(40)
Формула (40) применяется многократно для независимых реализаций псевдослучайных
чисел
j
ξ
и генерируются моменты времени . Общее число таких искусственных моментов
времени определяется из условия, чтобы их было «много больше» реального числа
наблюдений, например, . Далее к этой выборке применяется метод вычисления
j
t
23
10 10÷NN
(,|)
R
L
ω
τ
с той же длиной окна , что и для реальных данных, но при смещении окон,
равных длине окна (чтобы получить независимые значения (36) для не перекрывающихся
окон), и рассматриваются полученные результаты. Пиковые значения
L
(,|)
R
L
ω
τ
на
искусственных данных дают пороги статистической значимости максимумов статистики
(36). Для формализации этого подхода можно построить эмпирическую функцию
                                                  11
   В   нашем    случае   m=2      и,     следовательно,           удвоенная          величина    (36)   имеет
асимптотическую плотность распределения χ 22 , равную e− x / 2 / 2 , а сама величина (36)

распределена асимптотически с экспоненциальной плотностью e− x или


                               Pr{R (ω ) < x} = 1 − e− x , N → ∞                                         (39)


при условии, что анализируемая последовательность моментов времени распределена
согласно пуассоновскому закону с постоянной интенсивностью.
   Недостатком этого подхода является его асимптотический характер. Следовательно,
область его применимости ограничивается в основном «статическими» оценками, когда
периодические компоненты ищутся с использованием информации от всей выборки и эта
выборка   содержит   «достаточно       большое»        число       событий.         Если    же   вычисляется
«динамическая» оценка в скользящем временном окне, то число событий варьируется от
окна к окну и может достигать лишь нескольких десятков, что ставит вопрос о
применимости формулы (39). В этом случае более надежным является подход, основанный
на статистическом моделировании. Именно, вычисляется оценка средней интенсивности
точечного процесса по формуле μˆ 0 = N / T и генерируется длинная выборка моментов
времени, интервалы между которыми распределены по закону Пуассона с интенсивностью
μ̂0 . Согласно формуле (23) для этого последовательно вызывается датчик псевдослучайных
чисел ξ , равномерно распределенных на [0,1] и для каждого значения ξ j находится длина

интервала Δ t j до следующего события по формуле:


                              Δ t j = ln(1 − ξ j ) / μˆ 0 , t j = t j −1 + Δ t j , t0 = 0                (40)


   Формула (40) применяется многократно для независимых реализаций псевдослучайных
чисел ξ j и генерируются моменты времени t j . Общее число таких искусственных моментов

времени определяется из условия, чтобы их было «много больше» реального числа
наблюдений, например, 102 N ÷ 103 N . Далее к этой выборке применяется метод вычисления
R(ω ,τ | L) с той же длиной окна L , что и для реальных данных, но при смещении окон,
равных длине окна (чтобы получить независимые значения (36) для не перекрывающихся
окон), и рассматриваются полученные результаты. Пиковые значения R(ω ,τ | L) на
искусственных данных дают пороги статистической значимости максимумов статистики
(36). Для формализации этого подхода можно построить эмпирическую функцию