Диалоги (июнь 2003 г.) - [3]

Шрифт
Интервал

А.Г. Так. Теперь – что же это за методы?

Б.М. Да. Но начнём с другого конца: на чём построены абсолютно все остальные бэкгеммоновские программы, за редчайшим исключением, за исключением, может быть, самых первых программ? Там был такой Берлинер… Может быть, вы про Берлинера расскажете?

Алексей Радионов: В любых программах фигурирует такая вещь, как оценка позиции, некоторые оценочные функции. Что это такое? В конце партии уже чётко видно, кто победил, кто проиграл – по доске мы можем сказать: да, действительно, такое-то количество очков выиграл один игрок, другой, соответственно, другое. Это видно в самом конце игры. А как оценить позицию, когда мы ещё до конца игры не добрались? Здесь, как правило, программа моделирует ходы противников с той целью, чтобы одна сторона стремилась свой выигрыш увеличить, а другая сторона стремилась уменьшить выигрыш противника. Вот, собственно, метод минимакса, минимизации и максимизации идёт отсюда.

Б.М. Но это стандартное. Это ещё пока не имеет отношения к недетерминизму.

А.Р. Да. Вот на подсчёте таких чередований минимума и максимума получается оценка позиций, которые уже не конечны, где ещё не ясно, кто и что выиграл, позиций на некоторых промежуточных уровнях, где-то в середине игры. Таким образом программа может оценить своё положение и принять тот ход, который либо гарантирует ей выигрыш, либо гарантирует какой-то минимальный проигрыш, то есть не ухудшает ситуацию.

В недетерминированных же играх появляется ещё тот фактор, что мы не знаем точно, как сложится игра в дальнейшем, то есть на игру влияют некоторые не от нас зависящие причины. Это либо показания кубиков (когда мы не можем предсказать, что выпадет заранее), либо какие-то другие случайные факторы. В нашем случае этих случайных факторов, именно показаний кубиков, – конечное количество вариантов, несколько комбинаций. Мы просматриваем каждую комбинацию и смотрим, как будет развиваться игра, если у нас выпали такие-то очки или другие очки, для каждой комбинации это…

А.Г. Но это увеличивает количество вариантов в прогрессии…

А.Р. Да, там появляются дополнительные…

Б.М. И не только увеличивают количество вариантов, кроме того, непонятно, какими алгоритмами здесь пользоваться, и к этим алгоритмам существуют (я снова на Берлинера клоню) разные подходы.

Первый подход – это просто случайное моделирование нескольких ветвей позиции, более точно – нити развития игры. Всё-таки русской терминологии нету, поэтому приходится вспоминать и одновременно переводить. Это один вариант программы. Но это всё было давно, это самые первые нардовские программы, датированные примерно 80-ми, может быть, 90-м годом, но не позже. А после этого все программы – абсолютно все, я не знаю ни одного исключения среди хороших программ, кроме нашей, – написаны на так называемой нейросетевой технологии. То есть там вообще, если немножко упрощать ситуацию, фактически и нет никакого метода минимакса. А вся оценка позиции сводится к статической. Ещё раз повторю, что я немножко ситуацию упрощаю, но в целом говорю правильно.

А.Г. То есть в каждый конкретный момент позиция оценивается как единственно возможная сейчас?

Б.М. Да.

А.Р. Здесь некоторые нюансы всё же есть – как раз с этими статическими оценками. Глядя на позицию, например, можно сказать, что вот в этой позиции мы гарантированно выиграем столько-то и столько-то. Остался вопрос: как получить эту точную оценку, чтобы она была как можно более адекватна? Но построение оценочной функции с нейросетевым подходом заключается в том, что нейропрограмма, основанная на нейросети, производит огромное количество партий сама с собой, то есть происходит самообучение, настройка нейросети с той целью, чтобы значение оценки для тех позиций, которые выдаёт нейросеть, было как можно более адекватно. А мера адекватности здесь уже – это количество выигрышей.

Б.М. Сейчас я перебью опять. Этот подход и в шахматах осуществляется, хотя я не знаю, насколько успешно он применяются в Deep Thought или в более совершённых, более новых версиях этого Deep'а (я даже не выучил название последнего Deep'а). Deep Thought – это который обыграл Каспарова, а в следующих я даже не знаю, используют это или не используют. Я просто знаю, что в шахматах такой подход тоже есть.

А.Р. Собственно, всё нацелено на получение точной оценки некоторой позиции. И у нас в работе такая же цель преследуется, просто делается это несколько другими методами.

Опять же, если вернуться к нейросетевым методам, программа обучает нейросеть, исследователь это видит по специальным характеристикам, по некоторым графикам, по частоте поражений и побед. И когда считается, что нейросеть уже достаточно обучена, программе достаточно перебрать возможные количества случайных исходов, может быть, на один уровень заглянуть вниз и предусмотреть, как может пойти противник, и, предполагая, что оценка позиции якобы точная, программа уже делает ход. Вот, собственно, та программа, о которой Борис Феликсович уже говорил, «Джели-фиш», при достаточно небольшом количестве нейронов считается одной из самых сильных.


Еще от автора Александр Гарриевич Гордон
Диалоги (октябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Этология любви.2. Парадигма современной генетики.3. Нейтрино.4. Миграции индоевропейцев.5. Квантовый мир и сознание.6. Пульсирующие ледники.7. Феномен марганца.8. Культурный ландшафт.9. Нейрональная пластичность.10. Эктоны.11. Три кризиса Розанова.


Диалоги (май 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами, и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (ноябрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (сентябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Эффекты сверхмалых доз.2. Рождение художественного текста.3. Предел времени.4. Солнечная система.5. Луна.6. Солнечная активность.7. Венера.8. Судьбы планет.9. Астероидная опасность.10. Грибы.11. Класс интеллектуалов.12. Математика нелинейного мира.13. Синхротронное излучение.


Диалоги (апрель 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Гравитация и космология2. Ископаемые ящеры3. Технологии виртуальной реальности4. Клональные позвоночные5. Экономическое пространство будущего6. Формула эмоций7. Внутреннее строение Земли8. Физика и метафизика9. Михаил Булгаков10. Размерность пространства в микромире11. Формы жизни бактерий12. Отражение Апокалипсиса.


Новогодняя пьеса

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Рекомендуем почитать
Ум первобытного человека

Книга известного американского антрополога, лингвиста и естествоиспытателя Франца Боаса содержит его взгляды на историю развития человеческой культуры и умственных способностей человека. Автор опровергает утверждение о существовании даровитых и менее одаренных рас; он показывает, что успехи и достижения различных рас, равно как и различия в их анатомических признаках, не являются доказательством различия их умственных дарований. Боас рассматривает вопрос об устойчивости человеческих типов, исследует влияние окружающей среды и наследственности на анатомическое строение и склад ума человека.


Капиталистическое отчуждение труда и кризис современной цивилизации

В монографии исследуются эволюция капиталистического отчуждения труда в течение последних ста лет, возникновение новых форм отчуждения, влияние растущего отчуждения на развитие образования, науки, культуры, личности. Исследование основывается на материалах философских, социологических и исторических работ.


Тайны продуктов питания

Пища всегда была нашей естественной и неизбежной потребностью, но отношение к ней менялось с изменением социальных условий. Красноречивым свидетельством этого является тот огромный интерес к разнообразным продуктам питания, к их природе и свойствам, который проявляет сегодня каждый из нас. Только, достигнув высокого уровня жизни и культуры, человек, свободный от проблемы — где и как добыть пищу, имеет возможность выбирать из огромного ассортимента высококачественных продуктов то, что отвечает его вкусу, что полезнее и нужнее ему, и не только выбирать, но и руководить своим питанием, строить его сообразно требованиям науки о питании и запросам собственного организма.


Социально-культурные проекты Юргена Хабермаса

В работе проанализированы малоисследованные в нашей литературе социально-культурные концепции выдающегося немецкого философа, получившие названия «радикализации критического самосознания индивида», «просвещенной общественности», «коммуникативной радициональности», а также «теоретиколингвистическая» и «психоаналитическая» модели. Автором показано, что основной смысл социокультурных концепций Ю. Хабермаса состоит не только в критико-рефлексивном, но и конструктивном отношении к социальной реальности, развивающем просветительские традиции незавершенного проекта модерна.


Вторжение: Взгляд из России. Чехословакия, август 1968

Пражская весна – процесс демократизации общественной и политической жизни в Чехословакии – был с энтузиазмом поддержан большинством населения Чехословацкой социалистической республики. 21 августа этот процесс был прерван вторжением в ЧССР войск пяти стран Варшавского договора – СССР, ГДР, Польши, Румынии и Венгрии. В советских средствах массовой информации вторжение преподносилось как акт «братской помощи» народам Чехословакии, единодушно одобряемый всем советским народом. Чешский журналист Йозеф Паздерка поставил своей целью выяснить, как в действительности воспринимались в СССР события августа 1968-го.


Сандинистская революция в Никарагуа. Предыстория и последствия

Книга посвящена первой успешной вооруженной революции в Латинской Америке после кубинской – Сандинистской революции в Никарагуа, победившей в июле 1979 года.В книге дан краткий очерк истории Никарагуа, подробно описана борьба генерала Аугусто Сандино против американской оккупации в 1927–1933 годах. Анализируется военная и экономическая политика диктатуры клана Сомосы (1936–1979 годы), позволившая ей так долго и эффективно подавлять народное недовольство. Особое внимание уделяется роли США в укреплении режима Сомосы, а также истории Сандинистского фронта национального освобождения (СФНО) – той силы, которая в итоге смогла победоносно завершить революцию.


Диалоги (март 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Теории антропогенеза.2. Генетическая история человечества.3. Сотворение человека.4. Древо языков.5. Биологическое разнообразие.6. Мифология поседневности.7. Синергетика.8. Загадки детских рисунков.9. Страх.10. Онтогенез хищных млекопитающих.11. Поиски чёрных дыр.12. Природа запаха.13. Теория резонансного пения.


Диалоги (декабрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (август 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (июль 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.14 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».