Искусственный интеллект - [116]

Шрифт
Интервал

Предполагается, что система управления аниматом имеет иерархическую архитектуру. Базовым элементом системы управления является отдельная функциональная система (ФС). Верхний уровень соответствует основным потребностям организма: питания, размножения, безопасности, накопления знаний. Более низкие уровни соответствуют тактическим целям поведения. Блоки всех этих уровней реализуются с помощью ФС. Управление с верхних уровней может передаваться на нижние уровни (от «суперсистем» к «субсистемам») и возвращаться назад. Предполагается, что система управления аниматом функционирует в дискретном времени t= 1, 2, ..., и в каждый такт времени активна только одна ФС.

Предполагается простая формализация ФС на основе адаптивных критиков. Формальная ФС моделирует следующие важные особенности ее биологического прототипа: а) прогноз результата действия, б) сравнение прогноза и результата, и в) коррекцию прогноза путем обучения в соответствующих нейронных сетях.

Схема адаптивного критика. Рассматриваемая схема адаптивного критика состоит из двух нейронных сетей: Модель и Критик. Предполагается, что производные по весам синапсов нейронных сетей могут быть вычислены обычным методом обратного распространения ошибки [42]. Также предполагается, что адаптивный критик предназначен для выбора одного из нескольких действий. Например, при управлении движением действиями могут быть: двигаться вперед, поворачивать вправо, поворачивать влево, стоять на месте. В каждый момент времени t адаптивный критик должен выбрать одно из возможных действий.

Цель адаптивного критика - максимизировать функцию суммарной награды «, U(t):

U{t) = Y>Jr>Jr{t>J) , t = t>0,t>ht>2,-,

J

где r(tj) - текущее подкрепление (награда r(l.j) > 0, или наказание r(tj) < 0), полученное адаптивным критиком в данный момент времени tj, у - коэффициент забывания, 0 < у < 1. т = t>J+\ - tj - шаг по времени. Коэффициент забывания учитывает, что чем дальше анимат «заглядывает» в будущее, тем меньше у него уверенность в оценке награды («рубль сегодня стоит больше, чем рубль завтра»).

Модель имеет два типа входов: 1) входы, характеризующие текущую ситуацию S(0 (сигналы из внешней и внутренней среды анимата), и 2) входы, характеризующие действия. Предполагается, что число возможных действий п невелико. Роль Модели - прогноз следующей ситуации S>p',(? г) для всех возможных действий о,, /—1,2,..., Па-

РоЛЬ Критика - оценка качества ситуаций F(S), в частности, прогнозируемых ситуаций S>p',(t I т) для всех возможных действий. Величина F(S) есть оценка аниматом функции суммарной награды U(t), которую можно получить в будущем, исходя из данной ситуации S. Эта оценка постепенно уточняется в процессе обучения.

При выборе действия применяется е -жадное правило [22]:

- с вероятностью 1 - £ выбирается действие с максимальным значением F(S>pr,(M-i)):

к = arg max { F(S>p,',(?+x))},

- с вероятностью s выбирается произвольное действие а,

О < £ « 1,

к - индекс выбираемого действия.

Применение этого правила означает, что с большой вероятностью выбирается действие, для которого максимальна оценка суммарной награды U(i). ожидаемой в будущем.

Обучение Модели проводится обычным методом обратного распространения ошибки [42]. Смысл обучения Модели -уточнение прогнозов будущих ситуаций.

Обучение Критика проводится методом ошибки временной разности [22]. Смысл обучения Критика состоит в том, чтобы итеративно уточнять оценки качества ситуаций F(S(/)) в соответствии с поступающими подкреплениями г.

Функционирование системы управления аниматом.

Предполагается следующая схема работы ФС в рамках функционирования всей системы управления аниматом. Каждая ФС представляет собой адаптивный критик, имеющий связи с некоторой суперсистемой (системой более высокого уровня иерархии) и, возможно, одной или несколькими субсистемами (системами более низкого уровня иерархии). ФС активизируется командой от суперсистемы; Модель и Критик функционируют так, как описано выше. В результате осуществляется выбор действия а. Дальнейшее зависит от вида действия а. Если действие - команда для исполнительных элементов, то такое действие выполняется сразу. Далее анимат получает подкрепление г из внешней или внутренней среды, и производится обучение в нейронных сетях Модели и Критика.

Другой тип действий - команды для субсисгем. Для такого действия подается команда активизации определенной субсистемы (выбор конкретной субсистемы определяется номером действия а). В этом случае сравнение прогноза и результата, оценка подкрепления г и обучение нейронных сетей откладывается до получения отчета от субсистемы.

После выполнения всех этих действий ФС посылает отчет об окончании своей работы суперсистеме.

Описанный способ работы ФС представляет собой обычный режим функционирования. Вводится также экстраординарный режим, который имеет место, если прогноз существенно отличается от фактического результата. В экстраординарном режиме величина е (вероятность выбора случайного действия) в данной ФС и ее субсистемах резко возрастает, и поиск новых решений включает большую случайную компоненту. Этот поиск может сопровождаться случайным формированием и селекцией новых функциональных систем, аналогично селекции нейронных групп в теории нейродарвинизма Дж. Эдельмана [43]. Таким образом, обычный режим функционирования может рассматриваться как тонкая настройка системы управления аниматом, в то время как экстраординарный режим - это грубый поиск подходящего поведения в чрезвычайных ситуациях.


Еще от автора автор неизвестный
Динь-Динь и верные друзья

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


История конструкций самолетов в СССР в 1951-1965 гг

Предлагаемая вниманию читателей книга является продолжением двухтомного справочника известного советского авиаконструктора и историка отечественной авиации Вадима Борисовича Шаврова. Его книги, выпущенные издательством "Машиностроение" под общим названием "История конструкций самолетов в СССР", не раз переиздавались и приобрели широкую известность в нашей стране и за рубежом. Они стали наиболее полными и авторитетными справочниками по истории отечественного самолетостроения. В последние годы жизни автор начал работу над следующим томом, однако по разным причинам выпустить подобное издание не представлялось возможным.


Владимир Осипович Богомолов - биографическая справка

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Сказки народов Африки, Австралии и Океании

 В книгу вошли сказки о животных, волшебные и бытовые сказки народов Африки, Австралии и Океании. Составление, вступление и примечание К. И. Позднякова, Б. Н. Путилова. Иллюстрации Л. Токмакова. .


Naruto Rpg

Naruto RpgНаправленность: Джен Автор: alchoz Беты (редакторы): Волчонок Кара , ДыханиеНочи Фэндом: Naruto, The Gamer (кроссовер) Рейтинг: R Жанры: Фэнтези, Фантастика, Экшн (action), AU, Мифические существа, Попаданцы Предупреждения: OOC, Мэри Сью (Марти Стью) Размер: Макси, 96 страниц Кол-во частей: 26 Статус: закончен Статус: Молодой человек из мира "The Gamer" попал в Наруто.


100 великих катастроф XX века

В очередной книге из серии «100 великих XX века» представлены описания наиболее значительных и трагических катастроф, повлекших за собой многочисленные человеческие жертвы и разрушения.


Рекомендуем почитать
XX век. Хроника необъяснимого. Открытие за открытием

Эта книга — о загадках и таинствах окружающей нас жизни, о смелых поисках и предположениях так называемой неофициальной науки — науки завтрашнего дня. К примеру, точны ли наши представления о возрасте человечества? Может быть, оно гораздо старше и первый человек катался на динозавре? Или: все ли подозревают о том, что рядом с нами существует другой мир, и, может быть, не один? И можно ли проникнуть туда? И где искать исчезнувшую навсегда под морскими водами Атлантиду? Да и была ли она когда-нибудь?..Читатель найдет в этом издании не только множество подобных вопросов, но и ответы на них, порой самые неожиданные, поистине на грани фантастики, но тем не менее доказательные.


Ванна Архимеда: Краткая мифология науки

Никола Витковски — профессор физики, издатель и редактор, известный во Франции своей популяризаторской деятельностью в научной сфере, написал эту книгу вместе со Свеном Ортоли — физиком и журналистом, освещающим научные вопросы для самых юных читателей.В «Ванне Архимеда» собраны привычные нашему слуху, знакомые со школьных лет эмблемы научного мира, парящего в заоблачных высотах: «Эврика!» Архимеда, яблоко Ньютона, таблица Менделеева, НЛО, Франкенштейн, черные дыры, змея Кекуле, кот Шрёдингера, — про что-то из этого мы читали тысячу раз, про другое приблизительно знаем, откуда взялось, про третье несомненно где-то слыхали, только никак не вспомнить, когда и что именно…Что на самом деле кроется за этими обыденными выражениями? Ортоли и Витковски раскрывают множество интригующих секретов, наглядно демонстрируя, как зарождается научная легенда и насколько тесно связаны две, казалось бы, противоположные крайности — наука и мифология.


Безопасность жизнедеятельности. Шпаргалка

Настоящее издание поможет систематизировать полученные ранее знания, а также подготовиться к экзамену или зачету и успешно их сдать. Пособие предназначено для студентов высших и средних образовательных учреждений.


Логопедическая ритмика для развития речи дошкольников

Книга содержит задания и упражнения для развития речи и движений ребенка. Их регулярное выполнение способствует развитию артикуляционных, темпо-ритмических и интонационно-мелодических навыков, координации движений и речи. Пособие предназначено для родителей, логопедов, воспитателей дошкольных образовательных учреждений, учителей начальной школы.


Русская расовая теория до 1917 года. Том 2

Выход фундаментального сборника «Русская расовая теория до 1917 г.» является выдающимся событием издательской и интеллектуальной жизни России начала XXI столетия.В сборник вошли работы основателей отечественной антропологии, психофизиологии и неврологии — труды А. П. Богданова, В. А. Мошкова, И. А. Сикорского, И. И. Мечникова, С. С. Корсакова и др.Издание затрагивает проблемы естественных различий между народами, которые в значительной мере предопределяют также и многие социально-политические процессы в современном мире.


Затаенное имя - Тайнопись в 'Слове о полку Игореве'

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.