Совместимость. Как контролировать искусственный интеллект - [31]

Шрифт
Интервал

Машина, действительно понимающая человеческий язык, была бы способна быстро накапливать огромные объемы человеческого знания, что позволило бы ей превзойти результаты 10 000 лет обучения более чем 100 млрд человек, живших на Земле. Представляется попросту нецелесообразным ждать, когда машина заново сделает все эти открытия с нуля, начав с первичных сенсорных данных.

В настоящее время, однако, технология естественного языка не способна выполнить задачу прочтения и понимания миллионов книг, многие из которых поставили бы в тупик даже высокообразованного человека. Такие системы, как Watson от IBM, прославившаяся победой над двумя людьми-чемпионами американской телевизионной игры Jeopardy!>{5} в 2011 г., способны извлекать простую информацию из четко сформулированных фактов, но не может строить комплексные структуры знания на основе текста, как и не в состоянии отвечать на вопросы, требующие построения длинных логических цепочек и использования информации из нескольких источников. Например, задача прочитать все доступные документы, относящиеся к концу 1973 г., и оценить (с объяснением) вероятный результат Уотергейта — процесса, приведшего к отставке президента Никсона, — далеко выходила бы за рамки сегодняшних возможностей.

Предпринимаются серьезные усилия по углублению анализа языка и выделению информации. Например, проект Aristo Института изучения ИИ им. Аллена ставит целью разработку систем, способных сдать школьные экзамены по естественным наукам после прочтения учебников и методических пособий[115]. Вот вопрос из теста за четвертый класс[116]:

Четвероклассники решили устроить гонки на роликовых коньках. Какая поверхность подойдет для этого лучше всего?

(А) гравий, (Б) песок, (В) асфальт, (Г) трава.


Машина сталкивается по крайней мере с двумя типами трудностей при ответе на этот вопрос. Во-первых, это классическая проблема понимания языка — уяснения смысла предложения: анализ синтаксической структуры, идентификация значимых слов и т. д. (Чтобы убедиться в этом, воспользуйтесь онлайновым переводчиком, чтобы перевести предложение на незнакомый вам язык, затем с помощью словаря этого языка попробуйте сделать обратный перевод на английский.) Во-вторых, это необходимость обыденного знания. Нужно сообразить, что «гонки на роликовых коньках» — это, по всей видимости, состязание на скорость между людьми, обутыми в коньки на роликах (имеющими их на ногах), а не гонки роликовых коньков. Нужно понять, что «поверхность» — то, на чем будут состязаться гонщики, а не сидеть зрители. Нужно знать, что означает «лучше всего» применительно к поверхности для гонки, и т. д. Подумайте, как изменился бы ответ, если заменить «четвероклассников» на «садистов-инструкторов армейского тренировочного лагеря».

Эти трудности можно обобщить, сказав, что чтение требует знания, а знание приобретается (по большей части) из чтения. Иными словами, перед нами классическая ситуация с курицей и яйцом. Можно рассчитывать на процесс бутстрэпа — «спасения утопающих силами самих утопающих», — когда система читает какой-нибудь простой текст, получает определенные знания, использует их для чтения более сложного текста, получает дополнительные знания и т. д. К сожалению, на деле происходит противоположное: приобретенное знание оказывается по большей части ошибочным, что вызывает ошибки при чтении, приводящие к еще более ошибочному знанию, и т. д.

Например, проект «Бесконечное изучение языка» (Never-Ending Language Learning, NELL) Университета Карнеги — Меллона является, пожалуй, самым амбициозным проектом бутстрэп-обучения языку, осуществляемым в настоящее время. С 2010 по 2018 г. NELL усвоил более 120 млн утверждений, читая англоязычные тексты в интернете[117]. Часть этих утверждений верна, например, что «Мейпл Лифс»>{6} играют в хоккей и выиграли Кубок Стэнли. Помимо фактов NELL постоянно учит новые слова, категории и семантические отношения. К сожалению, он уверен лишь в 3 % своих утверждений и нуждается в экспертах-людях, чтобы регулярно исправлять ложные или бессмысленные утверждения — например, что «Непал — это страна, также известная как Соединенные Штаты», а «ценность — сельскохозяйственный продукт, который обычно режут на базис».

Я подозреваю, что может не произойти единого прорыва, который обратил бы нисходящую спираль вспять. Базовый процесс бутстрэп-обучения кажется правильным: программа, которая знает достаточно фактов, может сообразить, на какой из них ссылается новое предложение, и, таким образом, узнать новую текстуальную форму выражения фактов, что впоследствии позволит ей открыть больше фактов, и так процесс продолжится. (Сергей Брин, сооснователь Google, опубликовал важную статью об идее бутстрэп-обучения в 1998 г.[118]) Безусловно, этому способствует предварительная подготовка в виде большого количества закодированного вручную знания и лингвистической информации. Повышение сложности репрезентации фактов — позволяющей отображать комплексные события, причинно-следственные связи, верования и отношения других и т. д., — а также совершенствование работы с неопределенностью в значениях слов и предложений могут постепенно вылиться в самосовершенствующийся, а не вырождающийся процесс обучения.


Рекомендуем почитать
Легенда о Вавилоне

Петр Ильинский, уроженец С.-Петербурга, выпускник МГУ, много лет работал в Гарвардском университете, в настоящее время живет в Бостоне. Автор многочисленных научных статей, патентов, трех книг и нескольких десятков эссе на культурные, политические и исторические темы в печатной и интернет-прессе США, Европы и России. «Легенда о Вавилоне» — книга не только о более чем двухтысячелетней истории Вавилона и породившей его месопотамской цивилизации, но главным образом об отражении этой истории в библейских текстах и культурных образах, присущих как прошлому, так и настоящему.


Открытия и гипотезы, 2005 №11

Научно-популярный журнал «Открытия и гипотезы» представляет свежий взгляд на самые главные загадки вселенной и человечества, его проблемы и открытия. Никогда еще наука не была такой интересной. Представлены теоретические и практические материалы.


Жители планет

«Что такое на тех отдаленных светилах? Имеются ли достаточные основания предполагать, что и другие миры населены подобно нашему, и если жизнь есть на тех небесных землях, как на нашей подлунной, то похожа ли она на нашу жизнь? Одним словом, обитаемы ли другие миры, и, если обитаемы, жители их похожи ли на нас?».


Знание-сила, 2000 № 07 (877)

Ежемесячный научно-популярный и научно-художественный журнал.


Меч и Грааль

Взыскание Святого Грааля, — именно так, красиво и архаично, называют неповторимое явление средневековой духовной культуры Европы, породившее шедевры рыцарских романов и поэм о многовековых поисках чудесной лучезарной чаши, в которую, по преданию, ангелы собрали кровь, истекшую из ран Христа во время крестных мук на Голгофе. В некоторых преданиях Грааль — это ниспавший с неба волшебный камень… Рыцари Грааля ещё в старых текстах именуются храмовниками, тамплиерами. История этого католического ордена, основанного во времена Крестовых походов и уничтоженного в начале XIV века, овеяна легендами.


Популярно о микробиологии

В занимательной и доступной форме автор вводит читателя в удивительный мир микробиологии. Вы узнаете об истории открытия микроорганизмов и их жизнедеятельности. О том, что известно современной науке о морфологии, методах обнаружения, культивирования и хранения микробов, об их роли в поддержании жизни на нашей планете. О перспективах разработок новых технологий, применение которых может сыграть важную роль в решении многих глобальных проблем, стоящих перед человечеством.Книга предназначена широкому кругу читателей, всем, кто интересуется вопросами современной микробиологии и биотехнологии.


Фактологичность

Специалист по проблемам мирового здравоохранения, основатель шведского отделения «Врачей без границ», создатель проекта Gapminder, Ханс Рослинг неоднократно входил в список 100 самых влиятельных людей мира. Его книга «Фактологичность» — это попытка дать читателям с самым разным уровнем подготовки эффективный инструмент мышления в борьбе с новостной паникой. С помощью проверенной статистики и наглядных визуализаций Рослинг описывает ловушки, в которые попадает наш разум, и рассказывает, как в действительности сегодня обстоят дела с бедностью и болезнями, рождаемостью и смертностью, сохранением редких видов животных и глобальными климатическими изменениями.


Кто мы и как сюда попали

Американский генетик Дэвид Райх – один из главных революционеров в области изучения древней ДНК, которая для понимания истории человечества оказалась не менее важной, чем археология, лингвистика и письменные источники. В своей книге Райх наглядно показывает, сколько скрытой информации о нашем далеком прошлом содержит человеческий геном и как радикально геномная революция меняет наши устоявшиеся представления о современных людях. Миграции наших предков, их отношения с конкурирующими видами, распространение культур – все это предстает в совершенно ином свете с учетом данных по ДНК ископаемых останков.


Расстроенная психика. Что рассказывает о нас необычный мозг

Все решения и поступки зарождаются в нашей психике благодаря работе нейронных сетей. Сбои в ней заставляют нас страдать, но порой дарят способность принимать нестандартные решения и создавать шедевры. В этой книге нобелевский лауреат Эрик Кандель рассматривает психические расстройства через призму “новой биологии психики”, плода слияния нейробиологии и когнитивной психологии. Достижения нейровизуализации, моделирования на животных и генетики помогают автору познавать тайны мозга и намечать подходы к лечению психических и даже социальных болезней.


Уравнение Бога. В поисках теории всего

«Уравнение Бога» – это увлекательный рассказ о поиске самой главной физической теории, способной объяснить рождение Вселенной, ее судьбу и наше место в ней. Знаменитый физик и популяризатор науки Митио Каку прослеживает весь путь удивительных открытий – от Ньютоновой революции и основ теории электромагнетизма, заложенных Фарадеем и Максвеллом, до теории относительности Эйнштейна, квантовой механики и современной теории струн, – ведущий к той великой теории, которая могла бы объединить все физические взаимодействия и дать полную картину мира.