ВУЗ:
Составители:
36
Для повышения точности описания наблюдаемых данных в качестве линий
тренда можно применять и более сложные уравнения (рис.1.10).
График температуры в городе Томске
y = -0,0418x
4
+ 0,8544x
3
- 5,7842x
2
+ 15,577x - 10,917
-2
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9 10
Дни
градусы
Рис. 1.10. График изменения температуры (с маркером) и линия тренда (без маркера),
описываемая полиномиальным уравнением четвертого порядка
Линию тренда можно продолжить на графике за пределы измеренных данных.
Такая задача анализа данных является самой важной в Data Mining и называется
прогнозом.
Конечно, в реальных ситуациях задачу прогноза необходимо решать с учетом
множества факторов, оказывающих то или иное влияние на наблюдаемую величину.
Однако продемонстрировать значимость выбора той или иной прогнозирующей
функции можно уже на одной переменной.
На рис. 1.11 показано два варианта прогноза изменения давления в
магистральном газопроводе: с помощью линейной (а) и с помощью квадратичной
(б) линии тренда.
Если, например, критическое давление, которое допускать нельзя по регламенту
равно 3 МПа, то линейный прогноз (рис. 1.11, а) покажет оператору, что у него еще
сеть запас времени для принятия мер. Более точный прогноз – квадратичный, –
показывает (рис. 1.11, б), что уже через секунду будет достигнуто критичное
давление, после которого возможен разрыв трубопровода и взрыв газа, что нередко
и бывает в реальных условиях эксплуатации.
На этом примере хорошо видно, как важно инженеру нефтегазового дела,
обслуживающему сложное взрывоопасное оборудование, уметь правильно
определять тенденцию изменения данных.
Более подробно эту тему можно изучить в курсе ИНТУИТа «Data Mining»
Чубукова И.А.
Страницы
- « первая
- ‹ предыдущая
- …
- 35
- 36
- 37
- 38
- 39
- …
- следующая ›
- последняя »
