Интеллектуальный анализ временных рядов. Ярушкина Н.Г - 232 стр.

UptoLike

232
Поскольку количество нечетких лингвистических меток, обозначающих
типы и интенсивности ЭТ конечно и ограничено градациями ACL-шкалы, то
принципиально можно построить ограниченное количество кластеров. Пусть
мощность множества S всевозможных кластеров, построенных на лингвистиче-
ских метках элементарных тенденций, равна k. После выполнения процедуры
кластеризации множества
сформировано k кластеров: S={ s
1
, s
2
,..s
k
}.Тогда
определим на множестве S функцию g_Clus: S
R, где R
Е
1
, вычисляющую
для каждого кластера его мощность, то есть количество элементарных тенден-
ций, входящих в каждый кластер. Функция g_Clus будет полезна при рассмот-
рении задачи частотного анализа нечетких тенденций.
Контрольные вопросы
1. Сформулируйте постановку задачи кластеризации в терминах эле-
ментарных тенденций.
2.
Какова суть алгоритма кластеризации?
3.
Дайте определение функции g_Clus.
5.4. Частотный анализ
Рассматривая свойства поведения НВР через призму нечетких тенденций,
интерпретируемых в рамках структурно-лингвистического в виде символов аб-
страктного языка LANG, естественно использовать технику частотного анализа,
используемого для анализа текстов. На основе частотного анализа текстов
обычно решаются задача определения авторства (распознавание типа поведе-
ния автора при генерации текстов), строятся словари и
таблицы распределения
частот слов.
Проводя аналогию между нечетким временным рядом, описанным лин-
гвистическими терминами нечетких тенденций, каждая из которых кодируется
словом и текстом, сформулируем задачу частотного анализа нечетких тенден-
ций на НВР.