Совесть. Происхождение нравственной интуиции - [30]

Шрифт
Интервал

Каким образом это непримечательное на первый взгляд открытие привело к колоссальному прорыву в исследовании обучения с подкреплением? Чтобы ответить на этот вопрос, нужно разобраться, что означает для мозга неожиданная награда и почему у нейронов в ВОП увеличивается частота импульсов. Самое время предоставить слово двум постдокторантам — Риду Монтегю и Питеру Дайану, с 1991 по 1993 год трудившимся в лаборатории Терри Сейновски в Институте Солка. Оба были поглощены проблемой механизмов обучения с подкреплением в мозге. Одинаково увлеченные вычислительными технологиями, они предлагали друг другу гипотезу за гипотезой, громили их, спорили о механизмах и снова вгрызались в проблему. Раз за разом[104].

Ознакомившись с полученными Шульцем результатами, Монтегю и Дайан поняли, что изменение частоты импульсов нейронов ВОП, когда обезьяна неожиданно получает порцию сока, выглядит как сигнал об ошибке. Скачок активности, судя по всему, подсказывает другой нейронной сети, что привычные ожидания были ложными. Поскольку получение сока — это ошибка в положительную сторону, нейроны, по сути, кричат «Ура!» и фоновый уровень возбуждения повышается. Если подача сока регулярно предваряется включением света, интенсивность реакции на загорающуюся лампочку возрастает: «Ура! Сейчас будет сок»[105]. После нескольких повторов связки «сначала свет, затем сок» подача сока начинает восприниматься как норма и становится ожидаемой. Поэтому нейроны возвращаются к фоновому состоянию, даже когда сок поступает. «Все как обычно, ничего нового», — как бы приговаривают они. Важно иметь в виду, что базовая частота импульсов не равносильна полному отсутствию сигнала, это сообщение о том, что ничего неожиданного не происходит. Таким образом, если предположить, что нейроны реагируют на ожидания, все встает на свои места, и результаты, озадачившие группу Шульца, уже не кажутся загадочными. Нейроны фактически строят предположения о том, что случится, и откликаются на то, что происходит в действительности (илл. 3.3).

Когда свет загорался, а сока не давали, нейроны снова сигналили об ошибке. Частота импульсов нейронов ненадолго падала ниже фоновой, поскольку действительность не оправдывала ожиданий: «У-у-у, зажали угощение».

Монтегю и Дайан, постоянно штудировавшие научную литературу, знали о существовании вычислительной модели использования сигналов об ошибке в машинном обучении, разработанной Ричардом Саттоном и Энди Барто[106]. Как они довольно скоро убедились, полученные Шульцем данные в эту модель вполне укладывались. И чем внимательнее Монтегю и Дайан присматривались, тем очевиднее было соответствие.

Вот как они соотнесли вычислительную модель и нейробиологические данные. Монтегю, Дайан и Сейновски[107] предположили, что для нейронов в ВОП самое главное — разница между тем, что ожидалось в определенный момент, и тем, что происходит в этот момент на самом деле. Нейроны реагируют на изменение, и с технической точки зрения это вполне логично, поскольку перемены подталкивают процесс познания[108]. Соответственно колебания частоты импульсов нейронов — это сигналы к обучению. Достаточно понять это, и проясняется базовый механизм спайковой активности в данных Шульца.


Илл. 3.3. Каждый из 12 рядов, изображенных на трех частях рисунка, представляет собой серию точек, и каждая точка отображает пик импульсной активности нейрона. Верхняя линия — это обобщенное изображение (гистограмма) спайков, возникающих в каждом из 12 рядов, выстроенных ниже. Вверху: нейрон находится в состоянии фоновой активности, пока обезьяна не получит награду в виде сока. Частота импульсов сразу же резко повышается, а затем возвращается к исходному значению. Посередине: после нескольких экспериментов, в которых сначала моргает лампочка, а затем через несколько секунд подается сок, нейроны реагируют увеличением частоты импульсов только на вспышку света и ожидание награды, а не на саму подачу сока. Внизу: если свет моргает, но сок в предполагаемый момент не поступает, импульсы нейронов опускаются ниже базового уровня. Вспышка света в данном примере — условный стимул (УС), а сок — награда (Н). Временной диапазон показан на нижней схеме в секундах, в целом он составляет около трех секунд.

Wolfram Schultz, Peter Dayan, and P. Read Montague, «A Neural Substrate of Prediction and Reward», Science 275, No. 5306 (1997): 1593–99


Но, увы, без проблем у Монтегю и Дайана не обошлось. В духе привычных представлений Шульц и его коллеги пришли в своей публикации к выводу, что нейроны, активность которых они зарегистрировали в ВОП, не отображали ожидания награды. Почему? Потому что рост интенсивности возбуждения у нейронов ВОП не распространялся на весь временной интервал между вспышкой света и подачей сока[109]. В момент включения света наблюдался короткий подъем, а затем все возвращалось к базовому уровню (см. илл. 3.3). В чем же проблема? Шульц с коллегами исходили из того, что нейроны ВОП «знают», когда ожидать сока, лишь в том случае, если спайковая активность удерживается на всем протяжении времени между вспышкой света и подачей сока. А значит, рассудили они, при отсутствии спайковой активности нейроны не могут сигнализировать ни об ожидании награды, ни о том, что ожидания обмануты. Значит, они делают что-то другое, например привлекают внимание к происходящему.


Рекомендуем почитать
Искусство феноменологии

Верно ли, что речь, обращенная к другому – рассказ о себе, исповедь, обещание и прощение, – может преобразить человека? Как и когда из безличных социальных и смысловых структур возникает субъект, способный взять на себя ответственность? Можно ли представить себе радикальную трансформацию субъекта не только перед лицом другого человека, но и перед лицом искусства или в работе философа? Книга А. В. Ямпольской «Искусство феноменологии» приглашает читателей к диалогу с мыслителями, художниками и поэтами – Деррида, Кандинским, Арендт, Шкловским, Рикером, Данте – и конечно же с Эдмундом Гуссерлем.


Диалектика как высший метод познания

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


О системах диалектики

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Семнадцать «или» и другие эссе

Лешек Колаковский (1927-2009) философ, историк философии, занимающийся также философией культуры и религии и историей идеи. Профессор Варшавского университета, уволенный в 1968 г. и принужденный к эмиграции. Преподавал в McGill University в Монреале, в University of California в Беркли, в Йельском университете в Нью-Хевен, в Чикагском университете. С 1970 года живет и работает в Оксфорде. Является членом нескольких европейских и американских академий и лауреатом многочисленных премий (Friedenpreis des Deutschen Buchhandels, Praemium Erasmianum, Jefferson Award, премии Польского ПЕН-клуба, Prix Tocqueville). В книгу вошли его работы литературного характера: цикл эссе на библейские темы "Семнадцать "или"", эссе "О справедливости", "О терпимости" и др.


Смертию смерть поправ

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Авантюра времени

«Что такое событие?» — этот вопрос не так прост, каким кажется. Событие есть то, что «случается», что нельзя спланировать, предсказать, заранее оценить; то, что не укладывается в голову, застает врасплох, сколько ни готовься к нему. Событие является своего рода революцией, разрывающей историю, будь то история страны, история частной жизни или же история смысла. Событие не есть «что-то» определенное, оно не укладывается в категории времени, места, возможности, и тем важнее понять, что же это такое. Тема «события» становится одной из центральных тем в континентальной философии XX–XXI века, века, столь богатого событиями. Книга «Авантюра времени» одного из ведущих современных французских философов-феноменологов Клода Романо — своеобразное введение в его философию, которую сам автор называет «феноменологией события».


Фактологичность

Специалист по проблемам мирового здравоохранения, основатель шведского отделения «Врачей без границ», создатель проекта Gapminder, Ханс Рослинг неоднократно входил в список 100 самых влиятельных людей мира. Его книга «Фактологичность» — это попытка дать читателям с самым разным уровнем подготовки эффективный инструмент мышления в борьбе с новостной паникой. С помощью проверенной статистики и наглядных визуализаций Рослинг описывает ловушки, в которые попадает наш разум, и рассказывает, как в действительности сегодня обстоят дела с бедностью и болезнями, рождаемостью и смертностью, сохранением редких видов животных и глобальными климатическими изменениями.


Расстроенная психика. Что рассказывает о нас необычный мозг

Все решения и поступки зарождаются в нашей психике благодаря работе нейронных сетей. Сбои в ней заставляют нас страдать, но порой дарят способность принимать нестандартные решения и создавать шедевры. В этой книге нобелевский лауреат Эрик Кандель рассматривает психические расстройства через призму “новой биологии психики”, плода слияния нейробиологии и когнитивной психологии. Достижения нейровизуализации, моделирования на животных и генетики помогают автору познавать тайны мозга и намечать подходы к лечению психических и даже социальных болезней.


Кто мы и как сюда попали

Американский генетик Дэвид Райх – один из главных революционеров в области изучения древней ДНК, которая для понимания истории человечества оказалась не менее важной, чем археология, лингвистика и письменные источники. В своей книге Райх наглядно показывает, сколько скрытой информации о нашем далеком прошлом содержит человеческий геном и как радикально геномная революция меняет наши устоявшиеся представления о современных людях. Миграции наших предков, их отношения с конкурирующими видами, распространение культур – все это предстает в совершенно ином свете с учетом данных по ДНК ископаемых останков.


Уравнение Бога. В поисках теории всего

«Уравнение Бога» – это увлекательный рассказ о поиске самой главной физической теории, способной объяснить рождение Вселенной, ее судьбу и наше место в ней. Знаменитый физик и популяризатор науки Митио Каку прослеживает весь путь удивительных открытий – от Ньютоновой революции и основ теории электромагнетизма, заложенных Фарадеем и Максвеллом, до теории относительности Эйнштейна, квантовой механики и современной теории струн, – ведущий к той великой теории, которая могла бы объединить все физические взаимодействия и дать полную картину мира.