Диалоги (июнь 2003 г.) - [3]

Шрифт
Интервал

А.Г. Так. Теперь – что же это за методы?

Б.М. Да. Но начнём с другого конца: на чём построены абсолютно все остальные бэкгеммоновские программы, за редчайшим исключением, за исключением, может быть, самых первых программ? Там был такой Берлинер… Может быть, вы про Берлинера расскажете?

Алексей Радионов: В любых программах фигурирует такая вещь, как оценка позиции, некоторые оценочные функции. Что это такое? В конце партии уже чётко видно, кто победил, кто проиграл – по доске мы можем сказать: да, действительно, такое-то количество очков выиграл один игрок, другой, соответственно, другое. Это видно в самом конце игры. А как оценить позицию, когда мы ещё до конца игры не добрались? Здесь, как правило, программа моделирует ходы противников с той целью, чтобы одна сторона стремилась свой выигрыш увеличить, а другая сторона стремилась уменьшить выигрыш противника. Вот, собственно, метод минимакса, минимизации и максимизации идёт отсюда.

Б.М. Но это стандартное. Это ещё пока не имеет отношения к недетерминизму.

А.Р. Да. Вот на подсчёте таких чередований минимума и максимума получается оценка позиций, которые уже не конечны, где ещё не ясно, кто и что выиграл, позиций на некоторых промежуточных уровнях, где-то в середине игры. Таким образом программа может оценить своё положение и принять тот ход, который либо гарантирует ей выигрыш, либо гарантирует какой-то минимальный проигрыш, то есть не ухудшает ситуацию.

В недетерминированных же играх появляется ещё тот фактор, что мы не знаем точно, как сложится игра в дальнейшем, то есть на игру влияют некоторые не от нас зависящие причины. Это либо показания кубиков (когда мы не можем предсказать, что выпадет заранее), либо какие-то другие случайные факторы. В нашем случае этих случайных факторов, именно показаний кубиков, – конечное количество вариантов, несколько комбинаций. Мы просматриваем каждую комбинацию и смотрим, как будет развиваться игра, если у нас выпали такие-то очки или другие очки, для каждой комбинации это…

А.Г. Но это увеличивает количество вариантов в прогрессии…

А.Р. Да, там появляются дополнительные…

Б.М. И не только увеличивают количество вариантов, кроме того, непонятно, какими алгоритмами здесь пользоваться, и к этим алгоритмам существуют (я снова на Берлинера клоню) разные подходы.

Первый подход – это просто случайное моделирование нескольких ветвей позиции, более точно – нити развития игры. Всё-таки русской терминологии нету, поэтому приходится вспоминать и одновременно переводить. Это один вариант программы. Но это всё было давно, это самые первые нардовские программы, датированные примерно 80-ми, может быть, 90-м годом, но не позже. А после этого все программы – абсолютно все, я не знаю ни одного исключения среди хороших программ, кроме нашей, – написаны на так называемой нейросетевой технологии. То есть там вообще, если немножко упрощать ситуацию, фактически и нет никакого метода минимакса. А вся оценка позиции сводится к статической. Ещё раз повторю, что я немножко ситуацию упрощаю, но в целом говорю правильно.

А.Г. То есть в каждый конкретный момент позиция оценивается как единственно возможная сейчас?

Б.М. Да.

А.Р. Здесь некоторые нюансы всё же есть – как раз с этими статическими оценками. Глядя на позицию, например, можно сказать, что вот в этой позиции мы гарантированно выиграем столько-то и столько-то. Остался вопрос: как получить эту точную оценку, чтобы она была как можно более адекватна? Но построение оценочной функции с нейросетевым подходом заключается в том, что нейропрограмма, основанная на нейросети, производит огромное количество партий сама с собой, то есть происходит самообучение, настройка нейросети с той целью, чтобы значение оценки для тех позиций, которые выдаёт нейросеть, было как можно более адекватно. А мера адекватности здесь уже – это количество выигрышей.

Б.М. Сейчас я перебью опять. Этот подход и в шахматах осуществляется, хотя я не знаю, насколько успешно он применяются в Deep Thought или в более совершённых, более новых версиях этого Deep'а (я даже не выучил название последнего Deep'а). Deep Thought – это который обыграл Каспарова, а в следующих я даже не знаю, используют это или не используют. Я просто знаю, что в шахматах такой подход тоже есть.

А.Р. Собственно, всё нацелено на получение точной оценки некоторой позиции. И у нас в работе такая же цель преследуется, просто делается это несколько другими методами.

Опять же, если вернуться к нейросетевым методам, программа обучает нейросеть, исследователь это видит по специальным характеристикам, по некоторым графикам, по частоте поражений и побед. И когда считается, что нейросеть уже достаточно обучена, программе достаточно перебрать возможные количества случайных исходов, может быть, на один уровень заглянуть вниз и предусмотреть, как может пойти противник, и, предполагая, что оценка позиции якобы точная, программа уже делает ход. Вот, собственно, та программа, о которой Борис Феликсович уже говорил, «Джели-фиш», при достаточно небольшом количестве нейронов считается одной из самых сильных.


Еще от автора Александр Гарриевич Гордон
Диалоги (март 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Теории антропогенеза.2. Генетическая история человечества.3. Сотворение человека.4. Древо языков.5. Биологическое разнообразие.6. Мифология поседневности.7. Синергетика.8. Загадки детских рисунков.9. Страх.10. Онтогенез хищных млекопитающих.11. Поиски чёрных дыр.12. Природа запаха.13. Теория резонансного пения.


Новогодняя пьеса

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Диалоги (октябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Этология любви.2. Парадигма современной генетики.3. Нейтрино.4. Миграции индоевропейцев.5. Квантовый мир и сознание.6. Пульсирующие ледники.7. Феномен марганца.8. Культурный ландшафт.9. Нейрональная пластичность.10. Эктоны.11. Три кризиса Розанова.


Диалоги (апрель 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Гравитация и космология2. Ископаемые ящеры3. Технологии виртуальной реальности4. Клональные позвоночные5. Экономическое пространство будущего6. Формула эмоций7. Внутреннее строение Земли8. Физика и метафизика9. Михаил Булгаков10. Размерность пространства в микромире11. Формы жизни бактерий12. Отражение Апокалипсиса.


Диалоги (май 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами, и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (июль 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.14 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Рекомендуем почитать
Пришельцы рядом

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


О "летающих тарелках"

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Пять пуль профессору Бюллю

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Откуда взялась Лапута

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Пища чужих богов

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Полтергейст на Самотёчной

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Диалоги (сентябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Эффекты сверхмалых доз.2. Рождение художественного текста.3. Предел времени.4. Солнечная система.5. Луна.6. Солнечная активность.7. Венера.8. Судьбы планет.9. Астероидная опасность.10. Грибы.11. Класс интеллектуалов.12. Математика нелинейного мира.13. Синхротронное излучение.


Диалоги (ноябрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (декабрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (август 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».