Диалоги (июнь 2003 г.) - [7]

Шрифт
Интервал

И всё-таки я азарту поддаюсь. Например, если я два хода назад стоял хорошо, на выигрыш, но что-то случилось, плохо кубики упали, и я начал стоять плохо. Я просто по инерции продолжаю у себя в мозгу применять пессимистическую функцию риска, оценивая позицию, чего, конечно, делать не надо. Программа же быстрее переключается и быстрее понимает, что всё не так хорошо происходит, как есть на самом деле, и программа переключается, например, от пессимистической к оптимистической функции риска, переключается гораздо быстрее чем я.

А.Р. Тут, наверное, стоит ещё заметить, что программа, в которой реализованы эти алгоритмы, но в которой не подобраны числовые коэффициенты (когда переключаться на какую стратегию, как, собственно, статично оценивать позицию, хорошая она или плохая), эта программа не является рабочей. Чтобы она заработала, необходимо её обучить. Обучение программы происходит, когда она играет сама с собой, тогда происходит, собственно, подгонка параметров таким образом, чтобы максимально улучшить качество игры, максимально повысить вероятность выигрыша.

Но здесь возникает уже другой вопрос – каким образом её учить? Если в играх сама с собой, то, наверное, это будет немного необъективно, так как в данном случае отношения не транзитивны: если программа выиграла у другой программы, а другая у третьей, то не обязательно, что первая выиграет у третьей. И выбор системы обучения – тоже очень интересная проблема. И, собственно, если её грамотно решить, то можно действительно надеяться на то, что получится продукт, который в 2004 году станет играть на должном уровне.

А.Г. То есть эту проблему вы ещё не решили?

Б.М. Решаем… всё-таки можно даже сказать, что решили. Здесь мы касаемся темы, о которой ещё сегодня не говорили. Это не нейросети, их мы очень мало применяем здесь. А это так называемые генетические алгоритмы. В научной литературе им посвящено гораздо меньше публикаций, чем нейросетям. Мне кажется – незаслуженно. Потому что и то, и другое – это альтернативный подход к эвристическому программированию. Чистые математики объясняют это так, что нейросети – это математически объяснимо, может быть математически доказано, а генетические алгоритмы – якобы нет. И приводят ссылки на работу Колмогорова-Арнольда, работу 50-х годов – но мне кажется, что для практического программирования эта работа представляет весьма малый интерес. И то, и другое, это разные альтернативы, разные подходы к эвристическому программированию. Наша «функция риска» – это тоже подход. Просто надо всё применять в разумных примерах, в разумных количествах.

Вот здесь возникает именно задача самообучения набора коэффициентов, среди которых, кроме всего прочего, коэффициенты самообучения функций риска, не только коэффициенты для оценки позиций, но и коэффициенты функций риска. Мне, по крайней мере, неизвестно хороших публикаций (чуть ли вообще никаких) про самообучение этих наборов коэффициентов. Есть, либо есть стандартный подход генетических алгоритмов, в котором тоже много не совсем правильного, либо просто, как в упомянутых книжках Вельского с компанией, сказано: «Было произведено самообучение». Было, хорошо было произведено, раз программа хорошая, раз, отставая в 70-х годах от американцев по технике, на той же самой технике «Каисса», победила. Значит, было хорошо самообучение произведено, но как оно было произведено, никакой теории по этому поводу не было.

А.Г. Получается, что в вашем случае, при ваших алгоритмах решения, самообучение важнее, чем в случае программ, которые строятся на нейросетях. Или я ошибаюсь?

А.Р. В нейросетях как раз всё построено на самообучении…

Б.М. Но там своё самообучение…

А.Р. Нейросеть нужно настроить, чтобы она играла. Это производится за счёт самообучения, иначе это просто будет…

А.Г. Я неправильно задал вопрос. Что вам важнее – выбрать метод обучения программы или… Грубо говоря, у вас ребёнок непослушный, непредсказуемый…

А.Р. Скажем так, это вопрос важный – вопрос выбора метода самообучения. Важный в чём? Нужно не просто чтобы программа сама с собой играла, а чтобы было много экземпляров такой программы, каждый немного по-своему настроенный. И вот эта вся толпа, играя друг с другом, устраивает турниры, выбирает победителя. Необходимо найти критерий, по которому решается, кто из них победитель. Собственно, кажется, это и есть швейцарская система?

Б.М. Да, в общем-то, это что-то похожее на швейцарскую систему. Потом это было немножко изменено, но это не настолько всё-таки важно, чтобы так подробно об этом говорить.

Здесь лучше, наверное, вспомнить ещё одну вещь, которая только начала встраиваться в программу. В классической теории Адельсона-Вельского программа, когда думает, за противника думает так же, как за себя. То есть на место противника ставит саму себя. Ещё один приём, который мы применяли – ставить на место противника не себя, а нечто другое, нечто более сложное, нечто более сильное. Потому что у нас-то есть действительно толпа (это такой жаргонный термин – толпа игроков), толпа объектов для самообучения. Это применяется, ещё раз скажу, и в других задачах дискретной оптимизации. И можно всегда взять того, который лидирует, в качестве условного противника, то есть программа, играя, в качестве условного противника берёт лидера.


Еще от автора Александр Гарриевич Гордон
Диалоги (октябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Этология любви.2. Парадигма современной генетики.3. Нейтрино.4. Миграции индоевропейцев.5. Квантовый мир и сознание.6. Пульсирующие ледники.7. Феномен марганца.8. Культурный ландшафт.9. Нейрональная пластичность.10. Эктоны.11. Три кризиса Розанова.


Диалоги (май 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами, и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (ноябрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (сентябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Эффекты сверхмалых доз.2. Рождение художественного текста.3. Предел времени.4. Солнечная система.5. Луна.6. Солнечная активность.7. Венера.8. Судьбы планет.9. Астероидная опасность.10. Грибы.11. Класс интеллектуалов.12. Математика нелинейного мира.13. Синхротронное излучение.


Диалоги (апрель 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Гравитация и космология2. Ископаемые ящеры3. Технологии виртуальной реальности4. Клональные позвоночные5. Экономическое пространство будущего6. Формула эмоций7. Внутреннее строение Земли8. Физика и метафизика9. Михаил Булгаков10. Размерность пространства в микромире11. Формы жизни бактерий12. Отражение Апокалипсиса.


Новогодняя пьеса

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Рекомендуем почитать
Ум первобытного человека

Книга известного американского антрополога, лингвиста и естествоиспытателя Франца Боаса содержит его взгляды на историю развития человеческой культуры и умственных способностей человека. Автор опровергает утверждение о существовании даровитых и менее одаренных рас; он показывает, что успехи и достижения различных рас, равно как и различия в их анатомических признаках, не являются доказательством различия их умственных дарований. Боас рассматривает вопрос об устойчивости человеческих типов, исследует влияние окружающей среды и наследственности на анатомическое строение и склад ума человека.


Капиталистическое отчуждение труда и кризис современной цивилизации

В монографии исследуются эволюция капиталистического отчуждения труда в течение последних ста лет, возникновение новых форм отчуждения, влияние растущего отчуждения на развитие образования, науки, культуры, личности. Исследование основывается на материалах философских, социологических и исторических работ.


Тайны продуктов питания

Пища всегда была нашей естественной и неизбежной потребностью, но отношение к ней менялось с изменением социальных условий. Красноречивым свидетельством этого является тот огромный интерес к разнообразным продуктам питания, к их природе и свойствам, который проявляет сегодня каждый из нас. Только, достигнув высокого уровня жизни и культуры, человек, свободный от проблемы — где и как добыть пищу, имеет возможность выбирать из огромного ассортимента высококачественных продуктов то, что отвечает его вкусу, что полезнее и нужнее ему, и не только выбирать, но и руководить своим питанием, строить его сообразно требованиям науки о питании и запросам собственного организма.


Социально-культурные проекты Юргена Хабермаса

В работе проанализированы малоисследованные в нашей литературе социально-культурные концепции выдающегося немецкого философа, получившие названия «радикализации критического самосознания индивида», «просвещенной общественности», «коммуникативной радициональности», а также «теоретиколингвистическая» и «психоаналитическая» модели. Автором показано, что основной смысл социокультурных концепций Ю. Хабермаса состоит не только в критико-рефлексивном, но и конструктивном отношении к социальной реальности, развивающем просветительские традиции незавершенного проекта модерна.


Вторжение: Взгляд из России. Чехословакия, август 1968

Пражская весна – процесс демократизации общественной и политической жизни в Чехословакии – был с энтузиазмом поддержан большинством населения Чехословацкой социалистической республики. 21 августа этот процесс был прерван вторжением в ЧССР войск пяти стран Варшавского договора – СССР, ГДР, Польши, Румынии и Венгрии. В советских средствах массовой информации вторжение преподносилось как акт «братской помощи» народам Чехословакии, единодушно одобряемый всем советским народом. Чешский журналист Йозеф Паздерка поставил своей целью выяснить, как в действительности воспринимались в СССР события августа 1968-го.


Сандинистская революция в Никарагуа. Предыстория и последствия

Книга посвящена первой успешной вооруженной революции в Латинской Америке после кубинской – Сандинистской революции в Никарагуа, победившей в июле 1979 года.В книге дан краткий очерк истории Никарагуа, подробно описана борьба генерала Аугусто Сандино против американской оккупации в 1927–1933 годах. Анализируется военная и экономическая политика диктатуры клана Сомосы (1936–1979 годы), позволившая ей так долго и эффективно подавлять народное недовольство. Особое внимание уделяется роли США в укреплении режима Сомосы, а также истории Сандинистского фронта национального освобождения (СФНО) – той силы, которая в итоге смогла победоносно завершить революцию.


Диалоги (март 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Теории антропогенеза.2. Генетическая история человечества.3. Сотворение человека.4. Древо языков.5. Биологическое разнообразие.6. Мифология поседневности.7. Синергетика.8. Загадки детских рисунков.9. Страх.10. Онтогенез хищных млекопитающих.11. Поиски чёрных дыр.12. Природа запаха.13. Теория резонансного пения.


Диалоги (декабрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (август 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (июль 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.14 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».