Диалоги (июнь 2003 г.) - [3]

Шрифт
Интервал

А.Г. Так. Теперь – что же это за методы?

Б.М. Да. Но начнём с другого конца: на чём построены абсолютно все остальные бэкгеммоновские программы, за редчайшим исключением, за исключением, может быть, самых первых программ? Там был такой Берлинер… Может быть, вы про Берлинера расскажете?

Алексей Радионов: В любых программах фигурирует такая вещь, как оценка позиции, некоторые оценочные функции. Что это такое? В конце партии уже чётко видно, кто победил, кто проиграл – по доске мы можем сказать: да, действительно, такое-то количество очков выиграл один игрок, другой, соответственно, другое. Это видно в самом конце игры. А как оценить позицию, когда мы ещё до конца игры не добрались? Здесь, как правило, программа моделирует ходы противников с той целью, чтобы одна сторона стремилась свой выигрыш увеличить, а другая сторона стремилась уменьшить выигрыш противника. Вот, собственно, метод минимакса, минимизации и максимизации идёт отсюда.

Б.М. Но это стандартное. Это ещё пока не имеет отношения к недетерминизму.

А.Р. Да. Вот на подсчёте таких чередований минимума и максимума получается оценка позиций, которые уже не конечны, где ещё не ясно, кто и что выиграл, позиций на некоторых промежуточных уровнях, где-то в середине игры. Таким образом программа может оценить своё положение и принять тот ход, который либо гарантирует ей выигрыш, либо гарантирует какой-то минимальный проигрыш, то есть не ухудшает ситуацию.

В недетерминированных же играх появляется ещё тот фактор, что мы не знаем точно, как сложится игра в дальнейшем, то есть на игру влияют некоторые не от нас зависящие причины. Это либо показания кубиков (когда мы не можем предсказать, что выпадет заранее), либо какие-то другие случайные факторы. В нашем случае этих случайных факторов, именно показаний кубиков, – конечное количество вариантов, несколько комбинаций. Мы просматриваем каждую комбинацию и смотрим, как будет развиваться игра, если у нас выпали такие-то очки или другие очки, для каждой комбинации это…

А.Г. Но это увеличивает количество вариантов в прогрессии…

А.Р. Да, там появляются дополнительные…

Б.М. И не только увеличивают количество вариантов, кроме того, непонятно, какими алгоритмами здесь пользоваться, и к этим алгоритмам существуют (я снова на Берлинера клоню) разные подходы.

Первый подход – это просто случайное моделирование нескольких ветвей позиции, более точно – нити развития игры. Всё-таки русской терминологии нету, поэтому приходится вспоминать и одновременно переводить. Это один вариант программы. Но это всё было давно, это самые первые нардовские программы, датированные примерно 80-ми, может быть, 90-м годом, но не позже. А после этого все программы – абсолютно все, я не знаю ни одного исключения среди хороших программ, кроме нашей, – написаны на так называемой нейросетевой технологии. То есть там вообще, если немножко упрощать ситуацию, фактически и нет никакого метода минимакса. А вся оценка позиции сводится к статической. Ещё раз повторю, что я немножко ситуацию упрощаю, но в целом говорю правильно.

А.Г. То есть в каждый конкретный момент позиция оценивается как единственно возможная сейчас?

Б.М. Да.

А.Р. Здесь некоторые нюансы всё же есть – как раз с этими статическими оценками. Глядя на позицию, например, можно сказать, что вот в этой позиции мы гарантированно выиграем столько-то и столько-то. Остался вопрос: как получить эту точную оценку, чтобы она была как можно более адекватна? Но построение оценочной функции с нейросетевым подходом заключается в том, что нейропрограмма, основанная на нейросети, производит огромное количество партий сама с собой, то есть происходит самообучение, настройка нейросети с той целью, чтобы значение оценки для тех позиций, которые выдаёт нейросеть, было как можно более адекватно. А мера адекватности здесь уже – это количество выигрышей.

Б.М. Сейчас я перебью опять. Этот подход и в шахматах осуществляется, хотя я не знаю, насколько успешно он применяются в Deep Thought или в более совершённых, более новых версиях этого Deep'а (я даже не выучил название последнего Deep'а). Deep Thought – это который обыграл Каспарова, а в следующих я даже не знаю, используют это или не используют. Я просто знаю, что в шахматах такой подход тоже есть.

А.Р. Собственно, всё нацелено на получение точной оценки некоторой позиции. И у нас в работе такая же цель преследуется, просто делается это несколько другими методами.

Опять же, если вернуться к нейросетевым методам, программа обучает нейросеть, исследователь это видит по специальным характеристикам, по некоторым графикам, по частоте поражений и побед. И когда считается, что нейросеть уже достаточно обучена, программе достаточно перебрать возможные количества случайных исходов, может быть, на один уровень заглянуть вниз и предусмотреть, как может пойти противник, и, предполагая, что оценка позиции якобы точная, программа уже делает ход. Вот, собственно, та программа, о которой Борис Феликсович уже говорил, «Джели-фиш», при достаточно небольшом количестве нейронов считается одной из самых сильных.


Еще от автора Александр Гарриевич Гордон
Диалоги (май 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами, и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (октябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Этология любви.2. Парадигма современной генетики.3. Нейтрино.4. Миграции индоевропейцев.5. Квантовый мир и сознание.6. Пульсирующие ледники.7. Феномен марганца.8. Культурный ландшафт.9. Нейрональная пластичность.10. Эктоны.11. Три кризиса Розанова.


Диалоги (ноябрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.11 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (июль 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.14 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (апрель 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Гравитация и космология2. Ископаемые ящеры3. Технологии виртуальной реальности4. Клональные позвоночные5. Экономическое пространство будущего6. Формула эмоций7. Внутреннее строение Земли8. Физика и метафизика9. Михаил Булгаков10. Размерность пространства в микромире11. Формы жизни бактерий12. Отражение Апокалипсиса.


Новогодняя пьеса

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Рекомендуем почитать
Новосибирск 1917-1975 (Справочный материал)

Информационные материалы, предназначенные для делегатов XXV городской партийной конференции г. Новосибирска, проходившей в декабре 1975 г. Содержат фотографии и статистические данные, показывающие результаты развития города с 1917 по 70-е гг. XX века.


Описание Московии

«Описание Московии» Александра Гваньини является законченным произведением, в котором удачно сочетаются географические и этнографические сведения, очерки военного дела, торговли и строительства, нравов и обычаев русских, их религии. Человек пера, автор, литературно одарённый, Гваньини создал впервые оригинальное произведение, в основу которого, как он сам написал в посвящении «благосклонному читателю», лежат «труды учёных мужей и космографов, а также различных путешественников»; многое же автор постиг «благодаря собственному опыту и присутствию»; его наблюдения достаточно верны и глубоки. В своей работе Гваньини исходил из двух основных источников: «Записок о Московитских делах» австрийского дипломата Сигизмунда Герберштейна (1486–1566 гг.), побывавшего в Москве в 1517 и 1526 гг., (первым изданием вышли в Вене в 1549 г.) и «Краткого сказания о нравах и жестоком правлении тирана Московии Васильевича» Альберта Шлихтинга, немецкого путешественника, дворянина из Померании, несколько лет проведшего в русском плену.


Печатные СМИ Германии в условиях социально расколотого общества

Монография историка-германиста О.Е. Ореховой предлагает читателю полный анализ рынка прессы ФРГ после объединения Германии, раскрывает динамику тиражных тенденций с 1990 по 2007 гг. и освещает специфику редакционных концепций ведущих органов печатных СМИ ФРГ в условиях рекламно-газетного кризиса начала XXI века. Книга рассчитана на студентов-международников, аспирантов, исследователей-германистов, всех интересующихся историей и современным состоянием печатных органов ФРГ.


Пишем курсовую работу

Книга для чтения содержит иллюстративные примеры к принципам подготовки курсовых работ, взятые из текстов курсовых работ по направлению «Международные отношения». Теоретическое объяснение сопровождается фрагментами, при анализе которых студенты учатся не только выявлять и употреблять клише научного стиля речи, но и продуцировать собственные тексты с опорой на имеющиеся образцы.


В долинах золотого песка

Эта книга рассказывает о золоте — древнем и современном, об отношении к нему людей различных формаций. Она знакомит с тем, как образовалось золото, каковы его свойства и где оно встречается в природе, какие машины на наших приисках пришли на смену бутаре и промывочному лотку. В заключение говорится об использовании золота в технике сегодняшнего и завтрашнего дня.


Лишение свободы как родовое понятие и виды уголовного наказания: опыт теоретико-правового конструирования. Монография

В монографии рассматривается институт лишения свободы как родовое понятие и виды наказания, связанные с изоляцией осужденного от общества.В настоящей работе предпринята попытка теоретико-правового конструирования видов лишения свободы: тюремного заключения на срок или бессрочно; содержание в исправительной колонии открытого типа для отбывания заключительного этапа тюремного заключения; содержания в воспитательном центре несовершеннолетних заключенных.Для студентов, аспирантов, профессорско-преподавательского состава юридических ВУЗов, научных сотрудников, исследующих современные проблемы уголовного наказания.


Диалоги (март 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Теории антропогенеза.2. Генетическая история человечества.3. Сотворение человека.4. Древо языков.5. Биологическое разнообразие.6. Мифология поседневности.7. Синергетика.8. Загадки детских рисунков.9. Страх.10. Онтогенез хищных млекопитающих.11. Поиски чёрных дыр.12. Природа запаха.13. Теория резонансного пения.


Диалоги (декабрь 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (август 2003 г.)

Педаль газа выжата до упора. Человечество мчит по вечным коварным и непредсказуемым дорогам, отвечая по пути на иные вопросы, но неизменно оставляя без ответа вопрос: куда? Открытия, теории, гипотезы, цели учения, увеличивая объёмы наших знаний, ещё больше увеличивают наше незнание. При всём при этом остаются и звёздное небо над нами и нравственный закон внутри нас. Последний, правда, временами больше выглядит как нравственная беспредельщина.12 глав книги – это стенограммы ночных передач-диалогов телевизионной программы «Гордон».


Диалоги (сентябрь 2003 г.)

В настоящем сборнике представлены стенограммы ночных передач-диалогов телевизионной программы Александра Гордона:1. Эффекты сверхмалых доз.2. Рождение художественного текста.3. Предел времени.4. Солнечная система.5. Луна.6. Солнечная активность.7. Венера.8. Судьбы планет.9. Астероидная опасность.10. Грибы.11. Класс интеллектуалов.12. Математика нелинейного мира.13. Синхротронное излучение.