ВУЗ:
Составители:
Алгоритм использует жадную эвристику: на каждом этапе предпочтение отдается схеме, которая наиболее выгодно
может быть улучшена. На практике мы улучшаем в меньшей степени непротиворечивую схему среди уже обнаруженных.
Кластеризация осуществляется путем метода k-средних, подготовительной фазой для которого выступают процедуры
"поискСвойств" (обнаружение свойств для кластеризации) и "проекция" (для представления последовательностей в удобном
для метода k-средних формате).
Рассмотрим процедуру "поискСвойств" более подробно. В некоторых работах уже сталкивались с подобной задачей,
однако наша цель представить алгоритм нахождения таких свойств, которые были бы применимы именно в контексте полу-
чения комплексных WF-моделей.
Нам важны свойства, которые разделяют журнал наиболее выразительным образом. Для решения этой задачи введем
еще ряд определений.
Последовательность задач
]...[
1 h
α→→α
является l-частой в журнале
L
если
l
L
iiL
hii
h
≥
<<
∧αα∈α
||
}......,,|{
1
1
. Мы го-
ворим, что
]...[
1 h
α→→α
l-предшествует
α
в
L
, обозначаемой как
α→α→→α
lh
]...[
1
, если обе последовательности
]...[
1 h
α→→α
и
]...[
1
α→α→→α
h
являются l-частыми.
Определение 5 (Свойства). Свойство β – это выражение вида
αα→→α ]...[
1 h
такое, что (1)
]...[
1 h
α→→α
l-
частое свойство в
L
, (2)
α→α→→α
lh
]...[
1
не выполняется.
На основе этих определений представим алгоритм поиска наиболее дискриминирующих свойств:
Вход: Журнал выполнения
L
, величина
q
, максимальное количество свойств maxProps, граф зависимостей
q
CF
Выход: Множество минимальных свойств
Метод:
}),(|]{[:
21212 q
EL ∈ααα→α= ;
;0:;:,1:
2
=== FLRk
Повтор
1;k:k0;:M +==
Для всех
kj
L∈α→→α ]...[
1
выполнить
Для всех
2
][ Lb
j
∈→α
выполнить
Если
/]...[ →α→→α
ji
b
не в
F
, тогда
];...[: bMM
ji
→α→→α∪=
Для всех
Mp∈
выполнить
Если
−p
это
l
-частый в
L
, тогда
}{:
1
pL
k
=
+
Иначе
/]...{[: →α→→α∪=
ji
FF
}b
;
Конец Для всех;
1
:
+
∪=
k
LRR
;
Пока
0
1
=
+k
L
;
;0:';:' == FLS
Выполнить
=β :
argmax
|)','(|
'
Sw
F
β
∈β
};{':' β∪= FF
);',(':' SwSS β−=
Пока (
qLS
p
>||/|'|
)&&(
|'| F
<maxProps);
Вернуть
F'
;
Сначала на каждом этапе
k
выполнения мы добавляем в
k
L
все l-частые последовательности, чей размер равен
k
. И
этот процесс повторяется до тех пор, пока не будут найдены все l-частые последовательности разных размеров. Далее это
множество последовательностей фильтруется в соответствии с вводимыми при вызове метода ограничениями.
Представленный метод был реализован в программном прототипе и апробирован на реальных журналах выполнения
бизнес-процессов.
Страницы
- « первая
- ‹ предыдущая
- …
- 37
- 38
- 39
- 40
- 41
- …
- следующая ›
- последняя »