ИИ-2041. Десять образов нашего будущего - [27]

Шрифт
Интервал

«Боги под масками» — история о визуальном обмане, об обмане зрения. Научившись видеть, распознавать, понимать и синтезировать объекты, ИИ может также манипулировать ими, создавая изображения и видео, неотличимые от реальных. В рассказе описывается будущее, в котором люди больше не смогут полагаться на невооруженный глаз, если наверняка пожелают отличить подлинное видео от тонкого монтажа.

Сайтам и компьютерным приложениям придется (их обяжут законом) использовать антидипфейковый софт (как сегодня используются антивирусные программы), чтобы защитить пользователей от поддельных видео. В нашей истории перетягивание каната между создателями дипфейков и детекторов для их выявления уже переросло в гонку вооружений, и с переменным успехом побеждает тот, у кого больше вычислительных мощностей.

Действие рассказа происходит в 2041 году, но, вполне вероятно, подобная ситуация сложится и раньше — как только развитый мир сможет позволить себе огромные расходы на супердорогие компьютеры, программное обеспечение и ИИ-экспертов, необходимых для создания и обнаружения дипфейков и прочих манипуляций ИИ. И регулирующие эту сферу законы, скорее всего, будут приняты прежде всего в развитых странах. Наша история происходит в стране развивающейся — в ней негативные внешние эффекты дипфейков, по всей вероятности, проявятся несколько позже.

Итак, как же ИИ научается видеть — и через камеры, и через записанные видео? Как используются способности ИИ? Как работает создатель дипфейков, применяющий ИИ? Способны ли люди или ИИ обнаруживать дипфейки? Наполнят ли наши соцсети фейковые видео? Как остановить поток дипфейков? Какими еще дырами в безопасности может быть чреват ИИ? И есть ли что-нибудь полезное в технологии, позволяющей создавать дипфейки?

ЧТО ТАКОЕ КОМПЬЮТЕРНОЕ ЗРЕНИЕ?

В рассказе «Золотой слон» мы увидели потенциальные возможности глубокого обучения при работе с большими данными, в частности в интернете и финансах. Вряд ли вы удивляетесь тому, что ИИ опережает людей по эффективности обработки больших массивов данных. Но вот как насчет способностей, уникальных для человека или прочих живых существ, например восприятия?

Зрение — самый важный из органов чувств человека. Компьютерное (машинное) зрение — это отрасль ИИ, которая обучает компьютеры видеть. Это слово означает здесь не только оцифровку видео или изображения, но и осмысление того, что при этом «видит» компьютер. Алгоритмы компьютерного зрения позволяют реализовать следующие возможности (перечислены в порядке возрастания сложности):


• Получение изображений и их обработка — для реальных 3D-сцен в видео используются камеры и другие приборы-датчики. Каждое видео состоит из последовательности изображений, каждое изображение представляет собой двумерный массив чисел, представляющих конкретный цвет, где каждое число соответствует пикселю.

• Обнаружение объектов и сегментация изображения — изображение разбивается на области и определяется место расположения объектов.

• Распознавание объекта — распознается объект (например, собака) и, возможно, детальная информация (немецкая овчарка, темно-коричневый окрас, и так далее).

• Трекинг объекта — отслеживание движущихся объектов в последовательных изображениях или видео.

• Распознавание жестов и движений — движения идентифицируются, как, например, танцевальные па в игре для Xbox.

• Интерпретация сцены — обеспечивается понимание сцены в целом, включая неявные взаимоотношения и нюансы, например голодная собака, жадно глядящая на кость.


Инструменты для создания дипфейков, использованные Амакой в рассказе, содержат все эти компоненты. Чтобы отредактировать видео с АФАКом, Амаке сначала нужно было разбить его на фрагменты — 60 кадров в секунду, каждый из которых состоит из десятков миллионов пикселей. ИИ считывает эти пиксели и автоматически сегментирует тело АФАКа (или рисует вокруг него границу), которое далее сегментируется на лицо в маске, рот, руки и так далее. И так для каждого видеокадра.

Если видео длится 50 секунд, у нас будет три тысячи кадров (изображений). Кроме того, сопоставляется движение между кадрами, что позволяет выделить связи между объектами. Все это, заметьте, делается до того, как начнется редактирование видео.

Процесс представляется жутко трудоемким, но мы, люди, в своей жизни делаем это на раз-два. Нам достаточно лишь бросить взгляд, и все перечисленное уже проделано — тратится меньше секунды. Кроме того, люди обладают способностью к абстрактной и обобщающей интерпретации, причем даже если один и тот же объект выглядит по-разному под разными углами, при разном освещении, с разных расстояний или даже почти скрыт другими объектами.

Например, увидев человека, сидящего за столом в определенной позе, мы можем сделать вывод, что он держит ручку, нацелившись на лист бумаги, хотя на самом деле не видим ни того, ни другого.

Когда мы что-то «видим», мы, по сути, каждый раз задействуем все накопленные ранее знания о мире — все, что узнали за свою жизнь о перспективе, геометрии, здравом смысле и обо всем том, что видели до этого. У человека это происходит просто и естественно, но научить тому же самому компьютер крайне сложно.


Еще от автора Кайфу Ли
Мусорный прибой

Мими тонет в мусоре. Она работает на Кремниевом острове, где электроника – от сотовых телефонов и ноутбуков до роботов и бионических конечностей – отправляется на переработку. Отходы скапливаются и загрязняют каждый свободный дюйм земли. На этом острове у берегов Китая плоды капитализма и культуры потребления находят свой конец. Тысячи рабочих-мигрантов, таких как Мими, заманиваются на Кремниевый остров обещаниями стабильной работы и лучшей жизни. Назревает конфликт между безжалостными местными бандами, борющимися за власть.


Сверхдержавы искусственного интеллекта

Кай-Фу Ли – один из известнейших экспертов в области искусственного интеллекта. За долгую и блестящую карьеру он узнал изнутри, как работают Кремниевая долина США и IT-отрасль Китая, поэтому с уверенностью делает прогнозы о том, кто и почему победит в гонке ИИ. Но эта победа может обернуться безработицей и невиданным социальным расслоением по всему миру. Катастрофа почти неизбежна, но после серьезнейшего личного кризиса Кай-Фу Ли увидел неожиданный выход. Его укажут человечность и ответственность, а вовсе не армия умных машин. На русском языке публикуется впервые.


Рекомендуем почитать
Политическая экономия Николая Зибера. Антология

Николай Иванович Зибер (1844–1888) ― популяризатор Рикардо и Маркса, ставший марксистом еще до появления марксизма, знаток первобытной экономической культуры, предвосхитивший экономическую антропологию, критик маржинализма до его триумфа. В антологии представлены тексты разных лет о биографии и теоретическом наследии Зибера, опубликованы редкие архивные материалы и письма. Составители антологии выражают надежду, что сборник сформирует базу, на основе которой возможно по-новому оценить вклад Зибера в политическую экономию, марксизм, экономическую антропологию, а также быстрее и четче реконструировать различные контексты той эпохи.


Доллар всемогущий

Вы никогда не задумывались, почему мы можем позволить себе гораздо больше одежды, чем наши деды, но не дом, в котором ее хранить? Почему цена бензина может удвоиться за несколько месяцев, а падает гораздо медленнее? Почему правительства тех или иных стран игнорируют одни ужасные конфликты, происходящие на планете, но не стесняются вмешиваться в другие? За всем этим стоит экономика. Даршини Дэвид предлагает нам проследить за путешествием по земному шару одного доллара. Сегодня экономика США составляет меньше четверти мировой, но 87% сделок, заключаемых в иностранной валюте, совершаются именно в американской валюте – в долларах.


Капитал. Полная квинтэссенция 3-х томов

«Капитал» – главный труд немецкого экономиста и политического деятеля Карла Маркса, несомненно, оказавший влияние на мировую историю. Данное издание – это основные положения и идеи содержащиеся в «Капитале», обработанные немецким экономистом и политиком Ю. Борхардтом. Как отмечает сам Борхардт, ему «удалось передать теорию учения в правильной форме», что «дает ключ непосвященному или новичку к ее пониманию». Книга будет интересна как специалистам, так и всем интересующимся вопросами социально-экономических теорий.


Экономический кризис и перспективы развития капитализма

Вопреки дифирамбам французских энциклопедистов, а также мнению многих деятелей науки и культуры, живших в разные времена и считающих человека венцом творения, homo sapiens сам по себе не является идеальным и, к сожалению, все больше отдаляется от библейских стандартов. В наше время охваченные страстью потребительства люди далеко не всегда сознают, что творят. Ведь и современный кризис, как известно, стал следствием циничного прагматизма, а точнее, превысившей все пределы элементарной человеческой жадности руководителей банковских корпораций, которые в погоне за прибылью безответственно предоставили кредиты неспособным к их оплате потребителям.


Падение титанов. Сага о ««Форде», «Крайслере», «Дженерал моторс» и упущенных возможностях

Захватывающая история о рождении и гибели американской автопромышленности: о гордыне, упущенных возможностях, недооценке японских производителей и вкусов граждан, несостоятельности корпоративной культуры. Чем история заканчивается? Для спасения легендарных брендов Обама вынул из карманов американских налогоплательщиков 100 миллиардов долларов — этой суммы хватило бы, чтобы купить все седаны и пикапы, имевшиеся на американском рынке в первой половине 2009 года.Лауреат Пулитцеровской премии Пол Инграссия пишет увлекательную историю о людях, идеях, ошибочных и гениальных решениях, драматизме профсоюзной политики.


Непубличный аспект кризиса демократии

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Суперобучение

Скотт Янг, изучив результаты последних исследований и опыт выдающихся личностей, нашел те методы обучения, которые дают максимальный эффект: позволяют лучше понять и запомнить информацию, а также раскрыть новые таланты. Он сформулировал девять принципов быстрого самообразования, позволяющие осваивать сложные навыки, получать необходимые знания, максимизировать конкурентные преимущества и выстраивать карьеру. Эти принципы пригодятся всем, кто хочет научиться чему-либо самостоятельно: овладеть языком (или несколькими языками), получить новую профессию или освоить несколько инструментов для создания продукта или бизнеса с нуля. На русском языке публикуется впервые.


Думай о смысле. Будни переводчика IT-текстов

Иван Чаплыгин рассказывает о сложных отношениях внутри пары автор – переводчик. Он позволит заглянуть на переводческую кухню и буквально на пальцах покажет, чем хороший перевод отличается от посредственного и откровенно плохого. Иван расскажет о чувстве слова, неоправданной русификации и переводческих головоломках. О заслуженной критике и необоснованных придирках. А еще о конкуренции среди переводчиков, о поиске заказчиков и об удовольствии от работы. Эта книга поможет вам понять, как находить суть в мутной воде авторского высказывания и как передавать смысл, не искажая оригинал и не привнося в него собственное звучание.


Никаких правил. Уникальная культура Netflix

Книга о корпоративной культуре Netflix, которая построена вокруг свободы и ответственности. Именно культура позволила компании вырасти из небольшой фирмы по прокату DVD в гиганта развлекательной индустрии.


Принципы изменения мирового порядка

Рэй Далио, успешный инвестор и один из самых влиятельных людей планеты, основатель компании Bridgewater, исследует империи прошлого, выявляет закономерности взлетов и падений ведущих мировых экономик и делает выводы относительно настоящего и будущего в сфере макроэкономики и геополитики.