Составители:
Рубрика:
79
где a
i
– факторы-причины, b
j
– факторы-следствия, q
ij
– оценки истинности
(силы) причинно-следственной связи между соответствующими факторами.
Оценка истинности определяется в процессе обучения (экспериментов или
наблюдений) как k
+
/k, k - общее количество экспериментов (примеров), а k
+
–
количество экспериментов, подтверждающих причинно-следственную связь
(положительных примеров).
Таким образом, после обучения мы имеем матрицу со значениями q
ij
в пределах интервала (0, 1). Если значение q
ij
≈1, это означает, что между
факторами a
i
и b
j
есть причинно-следственная связь и ее можно записать в виде
правила. Иногда в ДСМ-методе используется и матрица отрицательных
примеров M
-
.
8.3 Методы извлечения знаний из данных
Методы извлечения знаний состоят из:
- текстологических методов,
- методов автоматической обработки текстов.
Текстологические методы предназначены для получения инженером по
знаниям знаний из материализованных источников (монографии, учебники,
статьи методики, инструкции и другие носители профессиональных знаний).
Эти методы основываются не только на выявлении и понимании смысла
текста, но и на выделении базовых понятий и отношений, т. е. формировании
семантической (понятийной) структуры.
В инженерии знаний разработана методика анализа текстов в целях
извлечения и структурирования знаний.
Методика анализа текстов в целях извлечения и структурирования
знаний предусматривает:
- анализ микроструктуры текста,
- вычленение ключевых слов (компрессия или сжатие текста),
- формирование поля знаний на базе одного из языков представления
знаний.
Сжатие текста служит методологической основой для использования
текстологических процедур извлечения знаний. Текстологические методы самые
трудоемкие, они применяются, как правило, на начальном этапе создания СИИ.
где ai – факторы-причины, bj – факторы-следствия, qij – оценки истинности
(силы) причинно-следственной связи между соответствующими факторами.
Оценка истинности определяется в процессе обучения (экспериментов или
наблюдений) как k+/k, k - общее количество экспериментов (примеров), а k+ –
количество экспериментов, подтверждающих причинно-следственную связь
(положительных примеров).
Таким образом, после обучения мы имеем матрицу со значениями qij
в пределах интервала (0, 1). Если значение qij ≈1, это означает, что между
факторами ai и bj есть причинно-следственная связь и ее можно записать в виде
правила. Иногда в ДСМ-методе используется и матрица отрицательных
примеров M-.
8.3 Методы извлечения знаний из данных
Методы извлечения знаний состоят из:
- текстологических методов,
- методов автоматической обработки текстов.
Текстологические методы предназначены для получения инженером по
знаниям знаний из материализованных источников (монографии, учебники,
статьи методики, инструкции и другие носители профессиональных знаний).
Эти методы основываются не только на выявлении и понимании смысла
текста, но и на выделении базовых понятий и отношений, т. е. формировании
семантической (понятийной) структуры.
В инженерии знаний разработана методика анализа текстов в целях
извлечения и структурирования знаний.
Методика анализа текстов в целях извлечения и структурирования
знаний предусматривает:
- анализ микроструктуры текста,
- вычленение ключевых слов (компрессия или сжатие текста),
- формирование поля знаний на базе одного из языков представления
знаний.
Сжатие текста служит методологической основой для использования
текстологических процедур извлечения знаний. Текстологические методы самые
трудоемкие, они применяются, как правило, на начальном этапе создания СИИ.
79
Страницы
- « первая
- ‹ предыдущая
- …
- 78
- 79
- 80
- 81
- 82
- …
- следующая ›
- последняя »
