ВУЗ:
Составители:
Рубрика:
0
200
400
600
800
1000
1200
1400
13579
Миров ой
рекорд
Пот ребление
Тайланд
Эл.энергия
США
По этим данным мы можем формально, используя метод наименьших квадратов, подобрать
модели линейной зависимости каждого из трех показателей от каждого из остальных
показателей. Это приводит, например, к моделям
EHR
CHR
=− + =
=− + =
26255 7 131 0 900
129 30 0 350 0 871
2
2
.. .;
.., .;.
,
.993.0 ,0498.0860.0
;993.0 ,950.1990.23
2
2
=+−=
=+=
REC
RCE
(Заметим, кстати, что произведение угловых коэффициентов двух последних прямых,
соответствующих моделям линейной связи, в которых объясняемая и объясняющая
переменая меняются местами, равно 19 950 0 0498 0 993.. .
⋅
=
и совпадает со значением
коэффициента детерминации
R
2
в этих двух подобранных моделях.)
Мы видим, что во всех подобранных моделях значения коэффициента детерминации
весьма высоки, и это формально означает, что изменчивость “объясняющих” переменных в
этих моделях составляет значительный процент от изменчивости “объясняемой”
переменной, стоящей в левой части уравнения. Однако, вряд ли мы всерьез можем полагать,
что динамика роста суммарного производства электроэнергии в США действительно
объясняется динамикой роста мирового рекорда по прыжкам в высоту с шестом, несмотря
на высокое значение 0.9 коэффициента детерминации в первом из четырех уравнений.
В ситуациях, подобных последнему примеру, принято говорить о
фиктивной
(ложной, паразитной - spurious)
линейной связи между соответствующими показателями.
И такие ситуации часто встречаются при рассмотрении показателей, динамика изменений
которых обнаруживает заметный тренд
(убывание или возрастание) - именно такой характер
имеют исследуемые показатели в последнем примере.
Чтобы понять, почему это происходит, вспомним известное соотношение,
связывающее коэффициент детерминации
R
2
и квадрат выборочного коэффициента
корреляции между переменными y и x :
1400
1200
1000 Миров ой
800 рекорд
600 Потребление
400 Тайланд
200 Эл.энергия
0 США
1 3 5 7 9
По этим данным мы можем формально, используя метод наименьших квадратов, подобрать
модели линейной зависимости каждого из трех показателей от каждого из остальных
показателей. Это приводит, например, к моделям
E = −26255. + 7.131H , R 2 = 0.900;
C = −129.30 + 0.350 H , R 2 = 0.871; .
E = 23.90 + 19.950C , R 2 = 0.993;
C = −0.860 + 0.0498 E , R 2 = 0.993.
(Заметим, кстати, что произведение угловых коэффициентов двух последних прямых,
соответствующих моделям линейной связи, в которых объясняемая и объясняющая
переменая меняются местами, равно 19.950 ⋅ 0.0498 = 0.993 и совпадает со значением
коэффициента детерминации R 2 в этих двух подобранных моделях.)
Мы видим, что во всех подобранных моделях значения коэффициента детерминации
весьма высоки, и это формально означает, что изменчивость “объясняющих” переменных в
этих моделях составляет значительный процент от изменчивости “объясняемой”
переменной, стоящей в левой части уравнения. Однако, вряд ли мы всерьез можем полагать,
что динамика роста суммарного производства электроэнергии в США действительно
объясняется динамикой роста мирового рекорда по прыжкам в высоту с шестом, несмотря
на высокое значение 0.9 коэффициента детерминации в первом из четырех уравнений.
В ситуациях, подобных последнему примеру, принято говорить о фиктивной
(ложной, паразитной - spurious) линейной связи между соответствующими показателями.
И такие ситуации часто встречаются при рассмотрении показателей, динамика изменений
которых обнаруживает заметный тренд (убывание или возрастание) - именно такой характер
имеют исследуемые показатели в последнем примере.
Чтобы понять, почему это происходит, вспомним известное соотношение,
связывающее коэффициент детерминации R 2 и квадрат выборочного коэффициента
корреляции между переменными y и x :
Страницы
- « первая
- ‹ предыдущая
- …
- 186
- 187
- 188
- 189
- 190
- …
- следующая ›
- последняя »
