Код креативности. Как искусственный интеллект учится писать, рисовать и думать - [99]

Шрифт
Интервал

Следует помнить, что речь идет не об обычном трехмерном ландшафте, подобном тому, что вы можете увидеть, выглянув в окно, а о сложном математическом ландшафте, разные измерения которого соответствуют разным свойствам, зависящим от качеств, которыми может обладать то или иное слово. Определение и отбор таких качеств требуют особого искусства. Например, слово может иметь сильные географические или хронологические ассоциации или быть связано с миром искусства или спорта. Разумеется, у него может быть и несколько таких качеств, и в этом случае его положение будет определено по всем соответствующим направлениям. Например, Альберт Эйнштейн, поскольку он играл на скрипке, будет иметь координаты как по оси «ученые», так и по оси «музыканты». Но в измерении ученых его величина должна быть больше, чем в измерении музыкантов. Проанализировав 20 000 образцовых заданий, сотрудники IBM нашли около 2500 разных типов ответов, приблизительно 200 из которых охватывали более 50 % задаваемых вопросов.

Алгоритм Watson проводит анализ, состоящий из четырех этапов. Сначала он разбирает вопрос на части, чтобы получить некоторое представление о том, где может находиться ландшафт возможных ответов. После этого переходит к процессу выработки гипотез, в котором выбирает около 200 возможных ответов в зависимости от местоположения вопроса. Затем он оценивает разные гипотезы, для чего берет эти 200 многомерных точек и сводит их к точкам, лежащим на одной прямой, что приводит к ранжированию возможных ответов в соответствии с некой степенью достоверности этих ответов. Если уровень достоверности превышает определенный порог, алгоритм нажимает на кнопку зуммера и предлагает соответствующий ответ. Все это нужно проделать в течение нескольких секунд – иначе участвующие в игре люди ответят первыми.

Возьмем, например, такое задание:

ТО ЯМА, ТО КАНАВА: Место в Азии, прославившееся ужасным событием в ночь на 20 июня 1756 года.

Этот вопрос получит высокие значения географической и временной координат. Можно предположить, что что-то ужасное произошло 20 июня 1756 года в нескольких местах в Азии. Но слово «яма» в названии категории поможет алгоритму, когда он дойдет до этапа ранжирования разных гипотез. Значит, Калькуттская черная яма получит более высокий рейтинг, чем все остальные места Азии, связанные с этой же датой, и исходя из этого Watson сможет дать правильный ответ.

Встречающиеся в задании слова вроде «писать», «сочинять», «перо» или «опубликованный» уводят в направлении художественного творчества. Например, фраза «Исходно – поэма, написанная Александром Пушкиным» означает, что ответ следует искать в области «писателей». После того как алгоритм выберет 200 кандидатов, процедура ранжирования требует тщательного взвешивания значимости каждого из многих измерений, которые выбрала программа. Нужно найти способ измерить, насколько далек от задания гипотетический ответ. Точное семантическое совпадение с отрывком из Википедии может дать ответу очень высокий рейтинг, но оно должно сочетаться с другими факторами. Взять, к примеру, такое задание: «В 1594 году он стал работать сборщиком налогов в Андалусии». По семантическому соответствию высокие рейтинги получат ответы «Торо» и «Сервантес». Но во временном измерении у Сервантеса будет более высокое значение, потому что годы его жизни, 1547–1616, ближе к 1594 году, чем годы жизни Торо, родившегося в 1817-м.

Авторы алгоритма Watson разработали 50 разных критериев ранжирования. Алгоритм начинает с широкого спектра кандидатов, потому что на этом этапе еще неясно, какой ответ получит рейтинг наиболее вероятного. Поэтому алгоритм предпочитает включить в рассмотрение множество возможных ответов, а потом выбрать из них несколько с самыми высокими рейтингами. Это несколько похоже на выбор гостиницы. Сначала вы берете все гостиницы в том городе или районе, в котором вы собираетесь остановиться. Но потом вы применяете систему ранжирования в зависимости от цен и отзывов, так что в результате может оказаться, что жить имеет смысл не в самой близкой к нужному месту гостинице.

То, как алгоритм производит ранжирование, позволяет ему учиться на собственных ошибках по восходящей схеме и уточнять свои параметры – как бы подкручивать регуляторы настройки своих функций. Тонкость заключается в том, чтобы определить такие оптимальные положения регуляторов, которые позволяют найти правильный ответ в максимальном количестве разных контекстов. Представьте себе вопрос: «С какой страной у Чили самая протяженная сухопутная граница?» Границы с Чили есть у двух стран – Аргентины и Боливии. Как бы вы ранжировали эти два потенциальных ответа? Можно решить присвоить более высокий рейтинг тому варианту, который чаще упоминается. В этом случае более высоко будет оценена Боливия, потому что между Чили и Боливией возникало много споров о границах и о них сообщалось в новостях. Но если рассмотреть материалы, больше связанные с географией, и подсчитать упоминания каждой из этих стран в таких документах, то более высокий рейтинг окажется у Аргентины, что на самом деле и соответствует правильному ответу.


Еще от автора Маркус дю Сотой
О том, чего мы не можем знать. Путешествие к рубежам знаний

«Хотя эта книга посвящена тому, чего мы знать не можем, также очень важно понять, что мы знаем. В этом путешествии к пределам знаний мы пройдем через области, уже нанесенные учеными на карты, до самых пределов последних на сегодняшний день достижений науки. В пути мы будем задерживаться, чтобы рассмотреть те моменты, когда ученые считали, что зашли в тупик и дальнейшее продвижение вперед невозможно, но следующее поколение исследователей находило иные пути. Это позволит нам по-новому взглянуть на то, что мы сегодня можем считать непознаваемым.


Тайны чисел: Математическая одиссея

«Умение математиков заглядывать в будущее наделило тех, кто понимает язык чисел, огромным могуществом. От астрономов древних времен, способных предсказать движения планет в ночном небе, до сегодняшних управляющих хедж-фондами, прогнозирующих изменения цен на фондовом рынке, – все они использовали математику, чтобы постичь будущее. Сила математики в том, что она может гарантировать стопроцентную уверенность в свойствах мира». Маркус дю Сотой Профессор математики Оксфордского университета, заведующий кафедрой Симони, сменивший на этой должности Ричарда Докинза, Маркус дю Сотой приглашает вас в незабываемое путешествие по необычным и удивительным областям науки, лежащей в основе каждого аспекта нашей жизни. В формате pdf A4 сохранен издательский дизайн.


Искусство мыслить рационально. Шорткаты в математике и в жизни

Принято считать, что залог успеха – упорный труд. Но подлинный успех приносит вовсе не он – его приносят шорткаты: более короткие и вместе с тем более легкие, более быстрые и более удобные пути решения той или иной задачи. Благодаря таким рациональным путям мы добиваемся выдающихся результатов. А по словам одного из величайших в мире математиков Маркуса дю Сотоя, математика – самое настоящее искусство шортката и лучшее средство экономии времени. Каждый из нас может сделать свою жизнь комфортнее при помощи нескольких шорткатов. «У вас есть выбор.


Рекомендуем почитать
Новосибирск 1917-1975 (Справочный материал)

Информационные материалы, предназначенные для делегатов XXV городской партийной конференции г. Новосибирска, проходившей в декабре 1975 г. Содержат фотографии и статистические данные, показывающие результаты развития города с 1917 по 70-е гг. XX века.


Описание Московии

«Описание Московии» Александра Гваньини является законченным произведением, в котором удачно сочетаются географические и этнографические сведения, очерки военного дела, торговли и строительства, нравов и обычаев русских, их религии. Человек пера, автор, литературно одарённый, Гваньини создал впервые оригинальное произведение, в основу которого, как он сам написал в посвящении «благосклонному читателю», лежат «труды учёных мужей и космографов, а также различных путешественников»; многое же автор постиг «благодаря собственному опыту и присутствию»; его наблюдения достаточно верны и глубоки. В своей работе Гваньини исходил из двух основных источников: «Записок о Московитских делах» австрийского дипломата Сигизмунда Герберштейна (1486–1566 гг.), побывавшего в Москве в 1517 и 1526 гг., (первым изданием вышли в Вене в 1549 г.) и «Краткого сказания о нравах и жестоком правлении тирана Московии Васильевича» Альберта Шлихтинга, немецкого путешественника, дворянина из Померании, несколько лет проведшего в русском плену.


Печатные СМИ Германии в условиях социально расколотого общества

Монография историка-германиста О.Е. Ореховой предлагает читателю полный анализ рынка прессы ФРГ после объединения Германии, раскрывает динамику тиражных тенденций с 1990 по 2007 гг. и освещает специфику редакционных концепций ведущих органов печатных СМИ ФРГ в условиях рекламно-газетного кризиса начала XXI века. Книга рассчитана на студентов-международников, аспирантов, исследователей-германистов, всех интересующихся историей и современным состоянием печатных органов ФРГ.


Пишем курсовую работу

Книга для чтения содержит иллюстративные примеры к принципам подготовки курсовых работ, взятые из текстов курсовых работ по направлению «Международные отношения». Теоретическое объяснение сопровождается фрагментами, при анализе которых студенты учатся не только выявлять и употреблять клише научного стиля речи, но и продуцировать собственные тексты с опорой на имеющиеся образцы.


В долинах золотого песка

Эта книга рассказывает о золоте — древнем и современном, об отношении к нему людей различных формаций. Она знакомит с тем, как образовалось золото, каковы его свойства и где оно встречается в природе, какие машины на наших приисках пришли на смену бутаре и промывочному лотку. В заключение говорится об использовании золота в технике сегодняшнего и завтрашнего дня.


Лишение свободы как родовое понятие и виды уголовного наказания: опыт теоретико-правового конструирования. Монография

В монографии рассматривается институт лишения свободы как родовое понятие и виды наказания, связанные с изоляцией осужденного от общества.В настоящей работе предпринята попытка теоретико-правового конструирования видов лишения свободы: тюремного заключения на срок или бессрочно; содержание в исправительной колонии открытого типа для отбывания заключительного этапа тюремного заключения; содержания в воспитательном центре несовершеннолетних заключенных.Для студентов, аспирантов, профессорско-преподавательского состава юридических ВУЗов, научных сотрудников, исследующих современные проблемы уголовного наказания.