Учебное пособие по курсу «Нейроинформатика» - [6]

Шрифт
Интервал

Слово близких, в постановке задачи, взято в кавычки, поскольку под близостью можно понимать множество разных отношений близости. Далее будет рассмотрен ряд примеров различных видов близости.

К сожалению, вид близости и число классов приходится определять исследователю, хотя существует набор методов (методы отжига) позволяющих оптимизировать число классов.

Формальная постановка задачи

Рассмотрим множество из m объектов {x}, каждый из которых является n-мерным вектором с действительными координатами (в случае комплексных координат особых трудностей с данным методом также не возникает, но формулы становятся более сложными, а комплексные значения признаков случаются редко).

Зададим пространство ядер классов E, и меру близости dist(a, x), где a — точка из пространства ядер, а x — точка из пространства объектов. Тогда для заданного числа классов k необходимо подобрать k ядер таким образом, чтобы суммарная мера близости была минимальной. Суммарная мера близости записывается в следующем виде:

(1)

где K>i — множество объектов i—го класса.

Сеть Кохонена

Сеть Кохонена для классификации на k классов состоит из k нейронов (ядер), каждый из которых вычисляет близость объекта к своему классу. Все нейроны работают параллельно. Объект считается принадлежащим к тому классу, нейрон которого выдал минимальный сигнал. При обучении сети Кохонена считается, что целевой функционал не задан (отсюда и название «Обучение без учителя»). Однако алгоритм обучения устроен так, что в ходе обучения минимизируется функционал (1), хотя и немонотонно.

Обучение сети Кохонена

Предложенный финским ученым Кохоненом метод обучения сети решению такой задачи состоит в следующем. Зададим некоторый начальный набор параметров нейронов. Далее предъявляем сети один объект x. Находим нейрон, выдавший максимальный сигнал. Пусть номер этого нейрона i. Тогда параметры нейрона модифицируются по следующей формуле:

a>i′=λx+(1-λ)a>i  (2)

Затем сети предъявляется следующий объект, и так далее до тех пор, пока после очередного цикла предъявления всех объектов не окажется, что параметры всех нейронов изменились на величину меньшую наперед заданной точности ε. В формуле (2) параметр λ называют скоростью обучения. Для некоторых мер близости после преобразования (2) может потребоваться дополнительная нормировка параметров нейрона.

Сеть Кохонена на сфере

Рис 1. Три четко выделенных кластера в исходном пространстве сливаются полностью (а) или частично (б) при проецировании на единичную сферу.


Одним из наиболее распространенных и наименее удачных (в смысле практических применений) является сферическая сеть Кохонена. В этой постановке предполагается, что все вектора-объекты имеют единичную длину. Ядра (векторы параметров нейронов) также являются векторами единичной длины. Привлекательность этой модели в том, что нейрон вычисляет очень простую функцию — скалярное произведение вектора входных сигналов на вектор параметров. Недостатком является большая потеря информации во многих задачах. На рис. 1 приведен пример множества точек разбитого на три четко выделенных кластера в исходном пространстве, которые сливаются полностью или частично при проецировании на единичную сферу.

Эта модель позволяет построить простые иллюстрации свойств обучения сетей Кохонена, общие для всех методов. Наиболее иллюстративным является пример, когда в двумерном пространстве множество объектов равномерно распределено по сфере (окружности), причем объекты пронумерованы против часовой стрелке. В начальный момент времени ядра являются противоположно направленными векторами.

Рис. 2. Положение ядер при последовательном предъявлении объектов со скоростью обучения 0,5. Состояние до обучения и после каждой эпохи обучения. Ниже приведен график изменения суммы квадратов изменений координат ядер.


На рис. 2 приведены состояния сети Кохонена перед началом обучения и после каждой эпохи обучения. Эпохой принято называть полный цикл предъявления обучающего множества (всех объектов, по которым проводится обучение). Ядра на рисунках обозначены жирными линиями. Из рисунка видно, что обучение зациклилось — после каждой эпохи сумма квадратов изменений координат всех ядер то уменьшается, то возрастает. В литературе приводится целый ряд способов избежать зацикливания. Один из них — обучать с малым шагом. На рис. 3 приведены состояния сети при скорости обучения 0,01.

Рис. 3. Положение ядер при последовательном предъявлении объектов со скоростью обучения 0,01. Состояние до обучения и после каждой эпохи обучения. Ниже приведен график изменения суммы квадратов изменений координат ядер.


Из анализа рис. 3 видно, что изменения ядер уменьшаются со временем. Однако в случае изначально неудачного распределения ядер потребуется множество шагов для перемещения их к «своим» кластерам (см. рис. 4).

Рис. 4. Обучение сети Кохонена со скоростью 0,01 (107 эпох)


Следующая модификация алгоритма обучения состоит в постепенном уменьшении скорости обучения. Это позволяет быстро приблизиться к «своим» кластерам на высокой скорости и произвести доводку при низкой скорости. Для этого метода необходимым является требование, чтобы последовательность скоростей обучения образовывала расходящийся ряд, иначе остановка алгоритма будет достигнута не за счет выбора оптимальных ядер, а за счет ограниченности точности вычислений. На рис. 5 приведены состояния сети Кохонена при использовании начальной скорости обучения 0,5 и уменьшения скорости в соответствии с натуральным рядом (1, ½, ⅓, …). Уменьшение скорости обучения производилось после каждой эпохи. Из графика изменения суммы квадратов изменений координат ядер видно, что этот метод является лучшим среди рассмотренных. На рис. 6 приведены результаты применения этого метода в случае неудачного начального положения ядер. Распределение объектов выбрано то же, что и на рисунке 4 — два класса по 8 объектов, равномерно распределенных в интервалах [π/4,3 π/4] и [5π/4, 7π/4].


Рекомендуем почитать
Дороги мира. История и современность

Книга знакомит с принципами строительства дорог и особенностями сухопутных дорожных сообщений с Древнего Рима до наших дней. Рассмотрены дороги в мирное и военное время. Представлен отечественный и зарубежный опыт дорожного строительства. Издание насыщено редкими сведениями и историческими фактами, различными картами, богатым архивным и иллюстрационным материалом. Книга предназначена самым разным категориям читательской аудитории, от специалистов дорожной отрасли и студентов профильных вузов до людей неравнодушных к истории и географии.


Русские электротехники

В книге освещается выдающаяся роль крупнейших русских электротехников XIX века в развитии мировой электротехнической мысли. Особенную ценность представляет то, что автор был непосредственным свидетелем многих приводимых им фактов, изобретений и открытий. Книга предназначена для широкого круга читателей, интересующихся историей науки и техники и может быть использована как учебное пособие.


На стартовой позиции

Эта книга о ракетах и ракетчиках. И обращена она прежде всего к молодым читателям, будущим защитникам Родины. К тем, которые, будучи призваны в ряды Вооруженных Сил СССР, попадут служить в Ракетные войска или, определяя свой жизненный путь, изберут военную профессию и захотят стать офицерами-ракетчиками.Авторы популярно рассказывают об устройстве различных типов ракет. Читатели побывают в своеобразном «подземном бастионе» — шахтной пусковой установке Ракетных войск стратегического назначения, на позициях зенитного ракетного комплекса и ракет Сухопутных войск, в кабине современной радиолокационной станции.Они познакомятся с солдатами, сержантами, прапорщиками и офицерами, комсомольцами и молодыми коммунистами 70-х годов, мастерами ракетного удара, страстно влюбленными в свою ракетную специальность.


Мечты в Сантьяго

Когда тридцать лет назад вооруженные силы Пиночета свергли чилийское правительство, они обнаружили коммуникационную систему революционеров - "социалистический интернет", опутавший всю страну. Его создатель? Эксцентричный ученый из Суррея. Энди Беккет -- о забытой истории Стаффорда Бира.


Правила работы с персоналом в организациях электроэнергетики Российской Федерации

Правила работы с персоналом в организациях электроэнергетики Российской Федерации (далее – Правила) разработаны на основании действующего законодательства Российской Федерации, государственных стандартов, существующих норм и правил и других нормативных документов.Настоящие правила устанавливают основные положения и требования к персоналу предприятий, организаций и учреждений, осуществляющих проектирование. эксплуатацию. ремонт. наладку. испытание. организацию и контроль работы оборудования, зданий и сооружений, входящих в состав электроэнергетического производства, независимо от форм собственности.Правила зарегистрированы в Минюсте России 16 марта 2000 г.


Тайны лунной гонки

В книге доктора наук (Ph.D.) США по специальности «Космическая политика и международные отношения», кандидата исторических наук (АН СССР), магистра внешней политики Высшей школы международных исследований им. Пола Нитце при университете им. Джонса Гопкинса (США), члена-корреспондента Российской академии космонавтики им. К. Э. Циолковского Ю. Ю. Караша всесторонне исследуется проблема противостояния и сотрудничества СССР и США в реализации величайшего инженерного замысла XX века — экспедиции людей на Луну. Автор приводит множество малоизвестных фактов, которые позволяют понять подоплеку произошедших событий.