Методы обработки информации. Крюкова Л.К - 4 стр.

UptoLike

Рубрика: 

4
Например, в ряд наблюдений пациентов с определенной патологией
может случайно попасть наблюдение пациента с другой патологией.
Дополнительная проверка исходного ряда позволяет исключить от'
счеты (выбросы), нарушающие однородность выборки.
Для проверки стационарности выводят часть отсчетов или всю
выборку в виде графика относительно горизонтальной оси. Стацио'
нарный процесс не должен «уходить» от оси абсцисс и содержать,
так называемые тренды.
1.1. Построение гистограммы
А. На базе проверенного на грубые ошибки и выбросы статисти'
ческого ряда (выборки данных) проводится группировка данных.
Для этого весь диапазон изменения данных разбивается на непе'
рекрывающиеся интервалы.
Число интервалов К рекомендуется брать от 5 до 30 (обычно
выбирается K = целая часть(10 lg N), где N – число наблюдений).
Б. Подсчитывается частота попадания отсчетов в интервалы.
Строится график в виде столбиков с основаниями на интервалах и
высотой, соответствующей частоте попадания отсчета в интервал.
1.2. Анализ гистограммы
А. По виду гистограммы также можно обнаружить грубые ошиб'
ки или выбросы.
Б. Нормировка гистограммы:
Обозначим C
i
– количество значений в i'м интервале.
Тогда f
i
= C
i
/N относительная частота для i'го интервала.
Поскольку
K
i
i
CN1
2
, то
/1
KK
ii
ii
fCN11
22
,
следовательно, площадь нормированной гистограммы близка к
единице и ее можно аппроксимировать теоретическим распределе'
нием.
В. Модальность гистограммы.
Форма гистограммы зависит от однородности выборки. Если ги'
стограмма имеет один максимум (унимодальная гистограмма), то
можно предположить, что выборка однородна и теоретическое рас'
пределение также унимодально.
При бимодальности нужно предположить, что в выборке при'
сутствуют значения из двух разных совокупностей.