Интеллектуальный анализ выполнения бизнес-процессов в системе электронного документооборота. Матвейкин В.Г - 39 стр.

UptoLike

Алгоритм использует жадную эвристику: на каждом этапе предпочтение отдается схеме, которая наиболее выгодно
может быть улучшена. На практике мы улучшаем в меньшей степени непротиворечивую схему среди уже обнаруженных.
Кластеризация осуществляется путем метода k-средних, подготовительной фазой для которого выступают процедуры
"поискСвойств" (обнаружение свойств для кластеризации) и "проекция" (для представления последовательностей в удобном
для метода k-средних формате).
Рассмотрим процедуру "поискСвойств" более подробно. В некоторых работах уже сталкивались с подобной задачей,
однако наша цель представить алгоритм нахождения таких свойств, которые были бы применимы именно в контексте полу-
чения комплексных WF-моделей.
Нам важны свойства, которые разделяют журнал наиболее выразительным образом. Для решения этой задачи введем
еще ряд определений.
Последовательность задач
]...[
1 h
αα
является l-частой в журнале
L
если
l
L
iiL
hii
h
<<
ααα
||
}......,,|{
1
1
. Мы го-
ворим, что
]...[
1 h
αα
l-предшествует
α
в
L
, обозначаемой как
ααα
lh
]...[
1
, если обе последовательности
]...[
1 h
αα
и
]...[
1
ααα
h
являются l-частыми.
Определение 5 (Свойства). Свойство β это выражение вида
ααα ]...[
1 h
такое, что (1)
]...[
1 h
αα
l-
частое свойство в
L
, (2)
ααα
lh
]...[
1
не выполняется.
На основе этих определений представим алгоритм поиска наиболее дискриминирующих свойств:
Вход: Журнал выполнения
L
, величина
q
, максимальное количество свойств maxProps, граф зависимостей
q
CF
Выход: Множество минимальных свойств
Метод:
}),(|]{[:
21212 q
EL αααα= ;
Повтор
1;k:k0;:M +==
Для всех
kj
Lαα ]...[
1
выполнить
Для всех
2
][ Lb
j
α
выполнить
Если
/]...[ αα
ji
b
не в
F
, тогда
];...[: bMM
ji
αα=
Для всех
Mp
выполнить
Если
p
это
l
-частый в
L
, тогда
}{:
1
pL
k
=
+
Иначе
/]...{[: αα=
ji
FF
}b
;
Конец Для всех;
1
:
+
=
k
LRR
;
Пока
0
1
=
+k
L
;
;0:';:' == FLS
Выполнить
=β :
argmax
|)','(|
'
Sw
F
β
β
};{':' β= FF
);',(':' SwSS β=
Пока (
qLS
p
>||/|'|
)&&(
|'| F
<maxProps);
Вернуть
F'
;
Сначала на каждом этапе
k
выполнения мы добавляем в
k
L
все l-частые последовательности, чей размер равен
k
. И
этот процесс повторяется до тех пор, пока не будут найдены все l-частые последовательности разных размеров. Далее это
множество последовательностей фильтруется в соответствии с вводимыми при вызове метода ограничениями.
Представленный метод был реализован в программном прототипе и апробирован на реальных журналах выполнения
бизнес-процессов.