Интеллектуальные информационные системы. Макаренко С.И. - 117 стр.

UptoLike

Составители: 

116
Здесь сказано существует априорная вероятность P(H)=0.01, что любой
наугад взятый человек болеет гриппом.
Допустим, программа задает вопрос 1 (симптом 1). Тогда мы имеем
P(E : H)=0.9 и P(E : не H)=0.01, а это означает, что если у пациента грипп, то
он в девяти случаях из десяти ответит «да» на этот вопрос, а если у него нет
гриппа, он ответит «да» лишь в одном случае из ста. Очевидно, ответ «да»
подтверждает гипотезу о том, что у него грипп. Ответ «нет» позволяет
предположить, что человек гриппом не болеет.
Так же и во второй группе симптомов (2, 1, 0.01). В этом случае
P(E : H)=0.9, т.е. если у человека грипп, то этот симптом должен
присутствовать. Соответствующий симптом может существовать и при
отсутствии гриппа (P(E : не H)=0.01), но это маловероятно.
Вопрос 3 исключает грипп при ответе «да», потому что P(E : H)=0. Это
может быть вопрос вроде такого: «наблюдаете ли вы такой симптом на
протяжении большей части жизни?» — или что-нибудь вроде этого.
Нужно подумать, а если вы хотите получить хорошие результаты, то
и провести исследование, чтобы установить обоснованные значения для
этих вероятностей. И если быть честным, то получение такой информации
вероятно, труднейшая задача, в решении которой компьютер также сможет
существенно помочь Вам.
Если вы напишите программу общего назначения, ее основой будет
теорема Байеса, утверждающая:
( ) ( )
P(E : H) P(H)
P(H : E)=
P(E : H) P(H) + P(E :
не H) P(не H) .
В данном случае мы начинаем с того, что Р(Н) = р для всех болезней.
Программа задает соответствующий вопрос и в зависимости от ответа
вычисляет P(H : E). Ответ «да» подтверждает вышеуказанные расчеты, ответ
«нет» тоже, но с (1 – p) вместо p и (1pn) вместо pn. Сделав так, мы
забываем об этом, за исключением того, что априорная вероятность P(H)
заменяется на P(H : E). Затем продолжается выполнение программы, но с
учетом постоянной коррекции значения P(H) по мере поступления новой
информации.
Описывая алгоритм, мы можем разделить программу на несколько
частей.
1. Ввод данных.
2. Просмотр данных на предмет нахождения априорной вероятности
P(H). Программа вырабатывает некоторые значения массива правил и
размещает их в массиве RULEVALUE. Это делается для того, чтобы
определить, какие вопросы (симптомы) являются самыми важными, и
    Здесь сказано существует априорная вероятность P(H)=0.01, что любой
наугад взятый человек болеет гриппом.
     Допустим, программа задает вопрос 1 (симптом 1). Тогда мы имеем
P(E : H)=0.9 и P(E : не H)=0.01, а это означает, что если у пациента грипп, то
он в девяти случаях из десяти ответит «да» на этот вопрос, а если у него нет
гриппа, он ответит «да» лишь в одном случае из ста. Очевидно, ответ «да»
подтверждает гипотезу о том, что у него грипп. Ответ «нет» позволяет
предположить, что человек гриппом не болеет.
     Так же и во второй группе симптомов (2, 1, 0.01). В этом случае
P(E : H)=0.9, т.е. если у человека грипп, то этот симптом должен
присутствовать. Соответствующий симптом может существовать и при
отсутствии гриппа (P(E : не H)=0.01), но это маловероятно.
    Вопрос 3 исключает грипп при ответе «да», потому что P(E : H)=0. Это
может быть вопрос вроде такого: «наблюдаете ли вы такой симптом на
протяжении большей части жизни?» — или что-нибудь вроде этого.
    Нужно подумать, — а если вы хотите получить хорошие результаты, то
и провести исследование, — чтобы установить обоснованные значения для
этих вероятностей. И если быть честным, то получение такой информации —
вероятно, труднейшая задача, в решении которой компьютер также сможет
существенно помочь Вам.
    Если вы напишите программу общего назначения, ее основой будет
теорема Байеса, утверждающая:
                                              P(E : H) ⋅ P(H)
                   P(H : E)=
                               ( P(E : H) ⋅ P(H) ) + ( P(E : не H) ⋅ P(не H) ) .
    В данном случае мы начинаем с того, что Р(Н) = р для всех болезней.
Программа задает соответствующий вопрос и в зависимости от ответа
вычисляет P(H : E). Ответ «да» подтверждает вышеуказанные расчеты, ответ
«нет» тоже, но с (1 – p) вместо p и (1 – pn) вместо pn. Сделав так, мы
забываем об этом, за исключением того, что априорная вероятность P(H)
заменяется на P(H : E). Затем продолжается выполнение программы, но с
учетом постоянной коррекции значения P(H) по мере поступления новой
информации.
      Описывая алгоритм, мы можем разделить программу на несколько
частей.
    1.   Ввод данных.
    2. Просмотр данных на предмет нахождения априорной вероятности
P(H). Программа вырабатывает некоторые значения массива правил и
размещает их в массиве RULEVALUE. Это делается для того, чтобы
определить, какие вопросы (симптомы) являются самыми важными, и



                                            116