ВУЗ:
Составители:
39
всех людей больными являются 2 %, то в обучающем множестве для сети,
диагностирующей заболевание, больных должно быть тоже 2 %. Если же
априорные вероятности будут отличаться от пропорций в обучающей вы-
борке, то сеть будет выдавать неправильный результат. Это можно учесть
(если известны априорные вероятности), вводя поправочные коэффициен-
ты для различных классов.
Второй вариант
модификации основан на следующей идее. Если
обучение сети основывается на зашумленных данных, это неизбежно бу-
дет приводить к отдельным ошибкам классификации. Иногда бывает целе-
сообразно считать, что некоторые виды ошибок обходятся «дороже» дру-
гих (например, если здоровый человек будет классифицирован как боль-
ной, то это вызовет лишние затраты на его обследование
, но не создаст уг-
розы для жизни; если же больной будет классифицирован как здоровый, то
это может привести к смертельному исходу). В такой ситуации значения,
которые выдает сеть, следует домножить на коэффициенты потерь, отра-
жающие относительную цену ошибок классификации, после чего в качест-
ве ответа берется класс, имеющий наименьшую оценку
потерь.
Следует отметить, что сети PNN достаточно хорошо выполняют
классификацию. Они быстро обучаются, допускают наличие ошибочных
данных и обеспечивают полезные результаты даже на малых выборках
учебных данных. Однако PNN оказываются весьма требовательными в от-
ношении ресурсов. В задачах, требующих большого объема обучающих
данных (сотни и тысячи примеров), сеть становится слишком громоздкой.
УПРАЖНЕНИЯ
1. Написать программу, обучающую сеть Кохонена (или вероятностную
нейронную сеть) классифицировать типы цветков ириса (Iris Setosa – 0,
Iris Versicolour – 1, Iris Virginica – 2) по 4 размерам их пестиков и тычи-
нок. База данных, расположенная, например, на сервере
www.basegroup.ru, содержит по 50 примеров каждого класса (всего 150
примеров). Первые 100 примеров используйте для обучения, остальные –
для тестирования.
2.
Написать программу, обучающую сеть Кохонена давать прогноз стои-
мости недвижимости в разных районах города. С помощью газет («Каме-
лот», «Из рук в руки») выбрать и произвести численное кодирование
10 наиболее важных параметров, определяющих стоимость жилья (жилая
площадь, размер кухни, престижность района и т.д.). Каждый нейрон Ко-
хонена определяет класс квартир,
близких по стоимости (например, 1-й
класс – квартиры стоимостью 200–210 тыс. рублей, 2-й класс – 210–
220 тыс. рублей и т.д.). Базу данных, включающую не менее 100 обучаю-
щих примеров, сформировать самостоятельно на основе информации из
газет.
всех людей больными являются 2 %, то в обучающем множестве для сети, диагностирующей заболевание, больных должно быть тоже 2 %. Если же априорные вероятности будут отличаться от пропорций в обучающей вы- борке, то сеть будет выдавать неправильный результат. Это можно учесть (если известны априорные вероятности), вводя поправочные коэффициен- ты для различных классов. Второй вариант модификации основан на следующей идее. Если обучение сети основывается на зашумленных данных, это неизбежно бу- дет приводить к отдельным ошибкам классификации. Иногда бывает целе- сообразно считать, что некоторые виды ошибок обходятся «дороже» дру- гих (например, если здоровый человек будет классифицирован как боль- ной, то это вызовет лишние затраты на его обследование, но не создаст уг- розы для жизни; если же больной будет классифицирован как здоровый, то это может привести к смертельному исходу). В такой ситуации значения, которые выдает сеть, следует домножить на коэффициенты потерь, отра- жающие относительную цену ошибок классификации, после чего в качест- ве ответа берется класс, имеющий наименьшую оценку потерь. Следует отметить, что сети PNN достаточно хорошо выполняют классификацию. Они быстро обучаются, допускают наличие ошибочных данных и обеспечивают полезные результаты даже на малых выборках учебных данных. Однако PNN оказываются весьма требовательными в от- ношении ресурсов. В задачах, требующих большого объема обучающих данных (сотни и тысячи примеров), сеть становится слишком громоздкой. УПРАЖНЕНИЯ 1. Написать программу, обучающую сеть Кохонена (или вероятностную нейронную сеть) классифицировать типы цветков ириса (Iris Setosa 0, Iris Versicolour 1, Iris Virginica 2) по 4 размерам их пестиков и тычи- нок. База данных, расположенная, например, на сервере www.basegroup.ru, содержит по 50 примеров каждого класса (всего 150 примеров). Первые 100 примеров используйте для обучения, остальные для тестирования. 2. Написать программу, обучающую сеть Кохонена давать прогноз стои- мости недвижимости в разных районах города. С помощью газет («Каме- лот», «Из рук в руки») выбрать и произвести численное кодирование 10 наиболее важных параметров, определяющих стоимость жилья (жилая площадь, размер кухни, престижность района и т.д.). Каждый нейрон Ко- хонена определяет класс квартир, близких по стоимости (например, 1-й класс квартиры стоимостью 200210 тыс. рублей, 2-й класс 210 220 тыс. рублей и т.д.). Базу данных, включающую не менее 100 обучаю- щих примеров, сформировать самостоятельно на основе информации из газет. 39
Страницы
- « первая
- ‹ предыдущая
- …
- 37
- 38
- 39
- 40
- 41
- …
- следующая ›
- последняя »