ВУЗ:
Составители:
96
обучающего шага, так что окончательное значение будет средней величиной от
всех входных векторов, на которых происходит обучение. Геометрически это
некоторый центр соответствующего кластера. Таким образом, в результате
самообучения слой 1 формирует кластеры в пространстве входных образов.
После обучения слоя 1 решение задачи в рабочем режиме сводится, по
существу, к отнесению каждого предъявляемого входного
образа к одному из
сформированных кластеров, т.е. определению его принадлежности
определенному классу.
Выбор начальных значений весовых векторов [16]. Перед началом
обучения всем весам сети следует придать некоторые начальные значения.
Общепринятой практикой является присваивание весам небольших случайных
значений, равномерно распределенных в некотором ограниченном диапазоне,
например (0-1). Нормализация начальных значений весов сокращает процесс
обучения, так как приближает их значения к нормализованным входным
векторам. Что же касается случайного равномерного распределения начальных
значений
весов (их рандомизация), то это может серьезно помешать процессу
самообучения слоя 1. Действительно, равномерное распределение весовых
векторов по поверхности гиперсферы в сочетании с неравномерным
распределением входных векторов приведет к тому, что лишь небольшая часть
весовых векторов будет использоваться для подстройки под входные вектора.
Т.е. большинство нейронов слоя 1 не будут задействовано, а
используемых
нейронов может не хватить для разделения близко расположенных входных
векторов на классы.
Здесь могут быть две неприятные крайности.
1. Кластеры входных векторов сконцентрированы на малой части
гиперсферы и, тем не менее, их необходимо правильно классифицировать. Если
начальная плотность весовых векторов в области кластеров слишком мала, то
их может не хватить
для правильной классификации всех кластеров. Ситуацию
иллюстрирует рис. 9.10, а, где для простоты каждый входной вектор
Х
представляет собой самостоятельный кластер и должен быть отнесен к
отдельному классу.
2. В области какого-либо кластера входных векторов начальная плотность
весовых векторов оказывается слишком высокой. Тогда образы этого кластера
могут быть неправильно разнесены в разные классы. В принципе, в
последующем слое 2 можно исправить эту ошибку и сгруппировать несколько
полученных подклассов
образов в один класс, но нейроны слоя 1 будут
использованы в этом случае не эффективно. Более того, для классификации
других кластеров оставшихся нейронов слоя 1 может не хватить. Ситуацию
иллюстрирует рис. 9.10, б, где два кластера содержат группы из 4-х и 3-х
входных векторов, и все векторы одной группы должны быть отнесены к
одному
классу.
Страницы
- « первая
- ‹ предыдущая
- …
- 94
- 95
- 96
- 97
- 98
- …
- следующая ›
- последняя »
