Составители:
Рубрика:
88
гипотеза приводила к построению отчета, анализу отчета и
выдвижению новой гипотезы и т. д. Это справедливо в том случае,
когда процесс поиска полностью контролируется человеком. Во
многих системах ИАД в этом процессе автоматизирована проверка
достоверности гипотез, что позволяет оценить вероятность тех или
иных зависимостей в базе данных.
2. Зависимости между данными ищутся автоматически.
Процесс поиска зависимостей распадается на три этапа:
1. Обнаружение зависимостей (discovery) состоит в просмотре базы
данных с целью автоматического выявления зависимостей. Проблема
здесь заключается в отборе действительно важных зависимостей из
огромного числа существующих в БД.
2. Прогнозирование (predictive modelling) предполагает, что
пользователь может предъявить системе записи с незаполненными
полями и запросить недостающие значения. Система сама
анализирует содержимое базы и делает правдоподобное
предсказание относительно этих значений.
3. Анализ аномалий (forensic analysis) — это процесс поиска
подозрительных данных, сильно отклоняющихся от устойчивых
зависимостей.
При выборе системы ИАД следует уделить внимание следующим
моментам:
1. Система ИАД должна предсказывать значения целевой переменной и
решать задачи классификации состояний объекта с тем, чтобы
подбирать наилучшие модели для каждого класса состояний.
2. Система должна автоматически выполнять тесты,
определяющие статистическую значимость развиваемой модели.
Произвольный комплекс даже случайно сгенерированных данных
может быть объяснен, если включить достаточно большое число
свободных параметров в модель. Однако такая модель не имеет
какой бы то ни было предсказательной силы. Эта проблема
называется «подгонкой» и часто является недостатком систем,
основанных на нейронных сетях.
3. Полученная модель должна быть легко интерпретируема. Если вы
не можете понять, какие знания модель содержит, как точно
целевая переменная зависит от независимых переменных, вы
практически не способны контролировать результаты. Вы не
сможете, опираясь на личный опыт, увидеть в найденной модели
возможные противоречия. Нейросети особенно опасны в этом
смысле, так как построенная модель представляет собой «черный
ящик». Куда более привлекательное представление знаний
гипотеза приводила к построению отчета, анализу отчета и
выдвижению новой гипотезы и т. д. Это справедливо в том случае,
когда процесс поиска полностью контролируется человеком. Во
многих системах ИАД в этом процессе автоматизирована проверка
достоверности гипотез, что позволяет оценить вероятность тех или
иных зависимостей в базе данных.
2. Зависимости между данными ищутся автоматически.
Процесс поиска зависимостей распадается на три этапа:
1. Обнаружение зависимостей (discovery) состоит в просмотре базы
данных с целью автоматического выявления зависимостей. Проблема
здесь заключается в отборе действительно важных зависимостей из
огромного числа существующих в БД.
2. Прогнозирование (predictive modelling) предполагает, что
пользователь может предъявить системе записи с незаполненными
полями и запросить недостающие значения. Система сама
анализирует содержимое базы и делает правдоподобное
предсказание относительно этих значений.
3. Анализ аномалий (forensic analysis) — это процесс поиска
подозрительных данных, сильно отклоняющихся от устойчивых
зависимостей.
При выборе системы ИАД следует уделить внимание следующим
моментам:
1. Система ИАД должна предсказывать значения целевой переменной и
решать задачи классификации состояний объекта с тем, чтобы
подбирать наилучшие модели для каждого класса состояний.
2. Система должна автоматически выполнять тесты,
определяющие статистическую значимость развиваемой модели.
Произвольный комплекс даже случайно сгенерированных данных
может быть объяснен, если включить достаточно большое число
свободных параметров в модель. Однако такая модель не имеет
какой бы то ни было предсказательной силы. Эта проблема
называется «подгонкой» и часто является недостатком систем,
основанных на нейронных сетях.
3. Полученная модель должна быть легко интерпретируема. Если вы
не можете понять, какие знания модель содержит, как точно
целевая переменная зависит от независимых переменных, вы
практически не способны контролировать результаты. Вы не
сможете, опираясь на личный опыт, увидеть в найденной модели
возможные противоречия. Нейросети особенно опасны в этом
смысле, так как построенная модель представляет собой «черный
ящик». Куда более привлекательное представление знаний
88
Страницы
- « первая
- ‹ предыдущая
- …
- 87
- 88
- 89
- 90
- 91
- …
- следующая ›
- последняя »
