Совесть. Происхождение нравственной интуиции - [30]

Шрифт
Интервал

Каким образом это непримечательное на первый взгляд открытие привело к колоссальному прорыву в исследовании обучения с подкреплением? Чтобы ответить на этот вопрос, нужно разобраться, что означает для мозга неожиданная награда и почему у нейронов в ВОП увеличивается частота импульсов. Самое время предоставить слово двум постдокторантам — Риду Монтегю и Питеру Дайану, с 1991 по 1993 год трудившимся в лаборатории Терри Сейновски в Институте Солка. Оба были поглощены проблемой механизмов обучения с подкреплением в мозге. Одинаково увлеченные вычислительными технологиями, они предлагали друг другу гипотезу за гипотезой, громили их, спорили о механизмах и снова вгрызались в проблему. Раз за разом[104].

Ознакомившись с полученными Шульцем результатами, Монтегю и Дайан поняли, что изменение частоты импульсов нейронов ВОП, когда обезьяна неожиданно получает порцию сока, выглядит как сигнал об ошибке. Скачок активности, судя по всему, подсказывает другой нейронной сети, что привычные ожидания были ложными. Поскольку получение сока — это ошибка в положительную сторону, нейроны, по сути, кричат «Ура!» и фоновый уровень возбуждения повышается. Если подача сока регулярно предваряется включением света, интенсивность реакции на загорающуюся лампочку возрастает: «Ура! Сейчас будет сок»[105]. После нескольких повторов связки «сначала свет, затем сок» подача сока начинает восприниматься как норма и становится ожидаемой. Поэтому нейроны возвращаются к фоновому состоянию, даже когда сок поступает. «Все как обычно, ничего нового», — как бы приговаривают они. Важно иметь в виду, что базовая частота импульсов не равносильна полному отсутствию сигнала, это сообщение о том, что ничего неожиданного не происходит. Таким образом, если предположить, что нейроны реагируют на ожидания, все встает на свои места, и результаты, озадачившие группу Шульца, уже не кажутся загадочными. Нейроны фактически строят предположения о том, что случится, и откликаются на то, что происходит в действительности (илл. 3.3).

Когда свет загорался, а сока не давали, нейроны снова сигналили об ошибке. Частота импульсов нейронов ненадолго падала ниже фоновой, поскольку действительность не оправдывала ожиданий: «У-у-у, зажали угощение».

Монтегю и Дайан, постоянно штудировавшие научную литературу, знали о существовании вычислительной модели использования сигналов об ошибке в машинном обучении, разработанной Ричардом Саттоном и Энди Барто[106]. Как они довольно скоро убедились, полученные Шульцем данные в эту модель вполне укладывались. И чем внимательнее Монтегю и Дайан присматривались, тем очевиднее было соответствие.

Вот как они соотнесли вычислительную модель и нейробиологические данные. Монтегю, Дайан и Сейновски[107] предположили, что для нейронов в ВОП самое главное — разница между тем, что ожидалось в определенный момент, и тем, что происходит в этот момент на самом деле. Нейроны реагируют на изменение, и с технической точки зрения это вполне логично, поскольку перемены подталкивают процесс познания[108]. Соответственно колебания частоты импульсов нейронов — это сигналы к обучению. Достаточно понять это, и проясняется базовый механизм спайковой активности в данных Шульца.


Илл. 3.3. Каждый из 12 рядов, изображенных на трех частях рисунка, представляет собой серию точек, и каждая точка отображает пик импульсной активности нейрона. Верхняя линия — это обобщенное изображение (гистограмма) спайков, возникающих в каждом из 12 рядов, выстроенных ниже. Вверху: нейрон находится в состоянии фоновой активности, пока обезьяна не получит награду в виде сока. Частота импульсов сразу же резко повышается, а затем возвращается к исходному значению. Посередине: после нескольких экспериментов, в которых сначала моргает лампочка, а затем через несколько секунд подается сок, нейроны реагируют увеличением частоты импульсов только на вспышку света и ожидание награды, а не на саму подачу сока. Внизу: если свет моргает, но сок в предполагаемый момент не поступает, импульсы нейронов опускаются ниже базового уровня. Вспышка света в данном примере — условный стимул (УС), а сок — награда (Н). Временной диапазон показан на нижней схеме в секундах, в целом он составляет около трех секунд.

Wolfram Schultz, Peter Dayan, and P. Read Montague, «A Neural Substrate of Prediction and Reward», Science 275, No. 5306 (1997): 1593–99


Но, увы, без проблем у Монтегю и Дайана не обошлось. В духе привычных представлений Шульц и его коллеги пришли в своей публикации к выводу, что нейроны, активность которых они зарегистрировали в ВОП, не отображали ожидания награды. Почему? Потому что рост интенсивности возбуждения у нейронов ВОП не распространялся на весь временной интервал между вспышкой света и подачей сока[109]. В момент включения света наблюдался короткий подъем, а затем все возвращалось к базовому уровню (см. илл. 3.3). В чем же проблема? Шульц с коллегами исходили из того, что нейроны ВОП «знают», когда ожидать сока, лишь в том случае, если спайковая активность удерживается на всем протяжении времени между вспышкой света и подачей сока. А значит, рассудили они, при отсутствии спайковой активности нейроны не могут сигнализировать ни об ожидании награды, ни о том, что ожидания обмануты. Значит, они делают что-то другое, например привлекают внимание к происходящему.


Рекомендуем почитать
Архитектура и иконография. «Тело символа» в зеркале классической методологии

Впервые в науке об искусстве предпринимается попытка систематического анализа проблем интерпретации сакрального зодчества. В рамках общей герменевтики архитектуры выделяется иконографический подход и выявляются его основные варианты, представленные именами Й. Зауэра (символика Дома Божия), Э. Маля (архитектура как иероглиф священного), Р. Краутхаймера (собственно – иконография архитектурных архетипов), А. Грабара (архитектура как система семантических полей), Ф.-В. Дайхманна (символизм архитектуры как археологической предметности) и Ст.


Сборник № 3. Теория познания I

Серия «Новые идеи в философии» под редакцией Н.О. Лосского и Э.Л. Радлова впервые вышла в Санкт-Петербурге в издательстве «Образование» ровно сто лет назад – в 1912—1914 гг. За три неполных года свет увидело семнадцать сборников. Среди авторов статей такие известные русские и иностранные ученые как А. Бергсон, Ф. Брентано, В. Вундт, Э. Гартман, У. Джемс, В. Дильтей и др. До настоящего времени сборники являются большой библиографической редкостью и представляют собой огромную познавательную и историческую ценность прежде всего в силу своего содержания.


Свободомыслие и атеизм в древности, средние века и в эпоху Возрождения

Атеизм стал знаменательным явлением социальной жизни. Его высшая форма — марксистский атеизм — огромное достижение социалистической цивилизации. Современные богословы и буржуазные идеологи пытаются представить атеизм случайным явлением, лишенным исторических корней. В предлагаемой книге дана глубокая и аргументированная критика подобных измышлений, показана история свободомыслия и атеизма, их связь с мировой культурой.


Вырождение. Современные французы

Макс Нордау"Вырождение. Современные французы."Имя Макса Нордау (1849—1923) было популярно на Западе и в России в конце прошлого столетия. В главном своем сочинении «Вырождение» он, врач но образованию, ученик Ч. Ломброзо, предпринял оригинальную попытку интерпретации «заката Европы». Нордау возложил ответственность за эпоху декаданса на кумиров своего времени — Ф. Ницше, Л. Толстого, П. Верлена, О. Уайльда, прерафаэлитов и других, давая их творчеству парадоксальную характеристику. И, хотя его концепция подверглась жесткой критике, в каких-то моментах его видение цивилизации оказалось довольно точным.В книгу включены также очерки «Современные французы», где читатель познакомится с галереей литературных портретов, в частности Бальзака, Мишле, Мопассана и других писателей.Эти произведения издаются на русском языке впервые после почти столетнего перерыва.


Несчастное сознание в философии Гегеля

В книге представлено исследование формирования идеи понятия у Гегеля, его способа мышления, а также идеи "несчастного сознания". Философия Гегеля не может быть сведена к нескольким логическим формулам. Или, скорее, эти формулы скрывают нечто такое, что с самого начала не является чисто логическим. Диалектика, прежде чем быть методом, представляет собой опыт, на основе которого Гегель переходит от одной идеи к другой. Негативность — это само движение разума, посредством которого он всегда выходит за пределы того, чем является.


Онтология поэтического слова Артюра Рембо

В монографии на материале оригинальных текстов исследуется онтологическая семантика поэтического слова французского поэта-символиста Артюра Рембо (1854–1891). Философский анализ произведений А. Рембо осуществляется на основе подстрочных переводов, фиксирующих лексико-грамматическое ядро оригинала.Работа представляет теоретический интерес для философов, филологов, искусствоведов. Может быть использована как материал спецкурса и спецпрактикума для студентов.


Фактологичность

Специалист по проблемам мирового здравоохранения, основатель шведского отделения «Врачей без границ», создатель проекта Gapminder, Ханс Рослинг неоднократно входил в список 100 самых влиятельных людей мира. Его книга «Фактологичность» — это попытка дать читателям с самым разным уровнем подготовки эффективный инструмент мышления в борьбе с новостной паникой. С помощью проверенной статистики и наглядных визуализаций Рослинг описывает ловушки, в которые попадает наш разум, и рассказывает, как в действительности сегодня обстоят дела с бедностью и болезнями, рождаемостью и смертностью, сохранением редких видов животных и глобальными климатическими изменениями.


Кто мы и как сюда попали

Американский генетик Дэвид Райх – один из главных революционеров в области изучения древней ДНК, которая для понимания истории человечества оказалась не менее важной, чем археология, лингвистика и письменные источники. В своей книге Райх наглядно показывает, сколько скрытой информации о нашем далеком прошлом содержит человеческий геном и как радикально геномная революция меняет наши устоявшиеся представления о современных людях. Миграции наших предков, их отношения с конкурирующими видами, распространение культур – все это предстает в совершенно ином свете с учетом данных по ДНК ископаемых останков.


Расстроенная психика. Что рассказывает о нас необычный мозг

Все решения и поступки зарождаются в нашей психике благодаря работе нейронных сетей. Сбои в ней заставляют нас страдать, но порой дарят способность принимать нестандартные решения и создавать шедевры. В этой книге нобелевский лауреат Эрик Кандель рассматривает психические расстройства через призму “новой биологии психики”, плода слияния нейробиологии и когнитивной психологии. Достижения нейровизуализации, моделирования на животных и генетики помогают автору познавать тайны мозга и намечать подходы к лечению психических и даже социальных болезней.


Уравнение Бога. В поисках теории всего

«Уравнение Бога» – это увлекательный рассказ о поиске самой главной физической теории, способной объяснить рождение Вселенной, ее судьбу и наше место в ней. Знаменитый физик и популяризатор науки Митио Каку прослеживает весь путь удивительных открытий – от Ньютоновой революции и основ теории электромагнетизма, заложенных Фарадеем и Максвеллом, до теории относительности Эйнштейна, квантовой механики и современной теории струн, – ведущий к той великой теории, которая могла бы объединить все физические взаимодействия и дать полную картину мира.