ИИ-2041. Десять образов нашего будущего - [28]

Шрифт
Интервал

Компьютерное зрение — область исследований, которая пытается преодолеть трудности и сделать так, чтобы компьютеры умели видеть и понимать то, что они видят.

СПОСОБЫ ПРИМЕНЕНИЯ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Уже сегодня мы практически ежедневно соприкасаемся с технологиями компьютерного зрения.

Их можно использовать в режиме реального времени в разнообразных областях — от транспорта до сферы безопасности. Приведу примеры.


• В автомобилях устанавливаются системы помощи водителю «Антисон», не дающие уснуть за рулем.

• Магазины без касс и очередей — типа Amazon Go: установленные в них камеры сами распознают товар, который вы кладете в корзину или возвращаете на полку.

• Охрана аэропортов (подсчет количества людей, распознавание террористов).

• Распознавание жестов (баллы за движения в танцевальных играх для Xbox).

• Распознавание лиц (использование лица пользователя для разблокировки мобильного телефона).

• Смарт-камеры (портретный режим вашего iPhone распознает и выделяет людей на переднем плане, а затем красиво размывает фон для создания эффекта фото, сделанного зеркальным фотоаппаратом).

• Военное дело (определение, кто напротив — солдат противника или мирный житель).

• Автономные системы навигации дронов и автомобилей.


В самом начале рассказа «Боги под масками» мы видели, как системы распознавания лиц используются в реальном времени для автоматической оплаты проезда — путем идентификации пассажиров, проходящих через турникет вокзала. И узнаем, что пешеходы, используя жестикуляцию, могут взаимодействовать с мультяшными животными в уличной рекламе. А смартстрим Амаки использует компьютерное зрение для распознавания городских улиц и указания маршрута, помогает ему добраться до незнакомого пункта назначения.

Кроме того, компьютерное зрение можно применять к изображениям и видео — не такими прямолинейными способами, но не менее полезными и важными. Приведу примеры:


• Интеллектуальное редактирование фотографий и видео (такие инструменты, как Photoshop, широко используют компьютерное зрение для удаления эффекта красных глаз и улучшения качества селфи).

• Анализ медицинских снимков (для определения наличия злокачественной опухоли на КТ-снимке легких).

• Модерирование (цензурирование) контента (обнаружение порнографического и насильственного контента в социальных сетях).

• Подбор сопутствующей рекламы, основанный на содержании конкретного видео.

• Интеллектуальный поиск изображений (находит нужное по ключевым словам или другим изображениям).

• И, конечно же, создание дипфейков (подмена лиц в видео).


В «Богах под масками» рассказывается об инструменте для создания дипфейков, который, по сути, является ничем иным, как автоматическим инструментом для редактирования видео; он по частям подменяет одного человека другим, начиная с черт лица, пальцев, ладоней и голоса и заканчивая жестами, походкой и мимикой. Поговорим об этом подробнее.

СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ (CNN) ДЛЯ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Заставить компьютерное зрение работать на основе стандартной нейронной сети оказалось очень непростой задачей — ведь любое изображение состоит из десятков миллионов пикселей, и научить систему глубокого обучения находить тончайшие подсказки и признаки в огромном количестве изображений — это, согласитесь, даже звучит устрашающе. В поисках вдохновения в деле усовершенствования этой технологии исследователи обратились к человеческому мозгу.

Зрительная зона коры головного мозга задействует нейроны, соответствующие множеству ограниченных областей (известных как рецептивные поля, или поля восприятия), в рамках которых наши глаза фиксируют изображение в любой конкретный момент времени. Рецептивные поля идентифицируют основные признаки видимых объектов: формы, линии, цвета или углы. Эти детекторы соединены с неокортексом, верхним слоем коры головного мозга (новой корой).

Неокортекс хранит информацию иерархически и обрабатывает выходы полей восприятия, преобразуя их в более сложную интерпретацию сцены.

Наблюдения за тем, как «видят» люди, и вдохновили разработчиков на изобретение так называемых сверточных нейронных сетей (CNN — convolutional neural networks). Самый низкий слой CNN состоит из большого числа фильтров, которые многократно применяются к изображению. Каждый из этих фильтров, как и рецептивные поля, может видеть только небольшие смежные участки изображения.

Глубокое обучение за счет оптимизации параметров на множестве изображений решает, что «замечает» каждый фильтр. Каждый фильтр выдает на выходе уверенность, что видел конкретный признак, им представляемый (например, черную линию). Более высокие слои CNN организованы иерархически, как и неокортекс. Они принимают выход уверенности от более низких слоев и обнаруживают более сложные признаки.

Например, если в CNN загружается изображение зебры, фильтры нижнего слоя могут искать в каждой области изображения только черные и белые линии, а более высокие слои будут видеть полоски, уши и ноги в больших зонах. Следующие слои могут увидеть множество полос, два уха и четыре ноги. На самом высоком слое части CNN могут целенаправленно пытаться отличить зебру от лошади или тигра.


Еще от автора Кайфу Ли
Мусорный прибой

Мими тонет в мусоре. Она работает на Кремниевом острове, где электроника – от сотовых телефонов и ноутбуков до роботов и бионических конечностей – отправляется на переработку. Отходы скапливаются и загрязняют каждый свободный дюйм земли. На этом острове у берегов Китая плоды капитализма и культуры потребления находят свой конец. Тысячи рабочих-мигрантов, таких как Мими, заманиваются на Кремниевый остров обещаниями стабильной работы и лучшей жизни. Назревает конфликт между безжалостными местными бандами, борющимися за власть.


Сверхдержавы искусственного интеллекта

Кай-Фу Ли – один из известнейших экспертов в области искусственного интеллекта. За долгую и блестящую карьеру он узнал изнутри, как работают Кремниевая долина США и IT-отрасль Китая, поэтому с уверенностью делает прогнозы о том, кто и почему победит в гонке ИИ. Но эта победа может обернуться безработицей и невиданным социальным расслоением по всему миру. Катастрофа почти неизбежна, но после серьезнейшего личного кризиса Кай-Фу Ли увидел неожиданный выход. Его укажут человечность и ответственность, а вовсе не армия умных машин. На русском языке публикуется впервые.


Рекомендуем почитать
Политическая экономия Николая Зибера. Антология

Николай Иванович Зибер (1844–1888) ― популяризатор Рикардо и Маркса, ставший марксистом еще до появления марксизма, знаток первобытной экономической культуры, предвосхитивший экономическую антропологию, критик маржинализма до его триумфа. В антологии представлены тексты разных лет о биографии и теоретическом наследии Зибера, опубликованы редкие архивные материалы и письма. Составители антологии выражают надежду, что сборник сформирует базу, на основе которой возможно по-новому оценить вклад Зибера в политическую экономию, марксизм, экономическую антропологию, а также быстрее и четче реконструировать различные контексты той эпохи.


Доллар всемогущий

Вы никогда не задумывались, почему мы можем позволить себе гораздо больше одежды, чем наши деды, но не дом, в котором ее хранить? Почему цена бензина может удвоиться за несколько месяцев, а падает гораздо медленнее? Почему правительства тех или иных стран игнорируют одни ужасные конфликты, происходящие на планете, но не стесняются вмешиваться в другие? За всем этим стоит экономика. Даршини Дэвид предлагает нам проследить за путешествием по земному шару одного доллара. Сегодня экономика США составляет меньше четверти мировой, но 87% сделок, заключаемых в иностранной валюте, совершаются именно в американской валюте – в долларах.


Капитал. Полная квинтэссенция 3-х томов

«Капитал» – главный труд немецкого экономиста и политического деятеля Карла Маркса, несомненно, оказавший влияние на мировую историю. Данное издание – это основные положения и идеи содержащиеся в «Капитале», обработанные немецким экономистом и политиком Ю. Борхардтом. Как отмечает сам Борхардт, ему «удалось передать теорию учения в правильной форме», что «дает ключ непосвященному или новичку к ее пониманию». Книга будет интересна как специалистам, так и всем интересующимся вопросами социально-экономических теорий.


Экономический кризис и перспективы развития капитализма

Вопреки дифирамбам французских энциклопедистов, а также мнению многих деятелей науки и культуры, живших в разные времена и считающих человека венцом творения, homo sapiens сам по себе не является идеальным и, к сожалению, все больше отдаляется от библейских стандартов. В наше время охваченные страстью потребительства люди далеко не всегда сознают, что творят. Ведь и современный кризис, как известно, стал следствием циничного прагматизма, а точнее, превысившей все пределы элементарной человеческой жадности руководителей банковских корпораций, которые в погоне за прибылью безответственно предоставили кредиты неспособным к их оплате потребителям.


Падение титанов. Сага о ««Форде», «Крайслере», «Дженерал моторс» и упущенных возможностях

Захватывающая история о рождении и гибели американской автопромышленности: о гордыне, упущенных возможностях, недооценке японских производителей и вкусов граждан, несостоятельности корпоративной культуры. Чем история заканчивается? Для спасения легендарных брендов Обама вынул из карманов американских налогоплательщиков 100 миллиардов долларов — этой суммы хватило бы, чтобы купить все седаны и пикапы, имевшиеся на американском рынке в первой половине 2009 года.Лауреат Пулитцеровской премии Пол Инграссия пишет увлекательную историю о людях, идеях, ошибочных и гениальных решениях, драматизме профсоюзной политики.


Непубличный аспект кризиса демократии

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Суперобучение

Скотт Янг, изучив результаты последних исследований и опыт выдающихся личностей, нашел те методы обучения, которые дают максимальный эффект: позволяют лучше понять и запомнить информацию, а также раскрыть новые таланты. Он сформулировал девять принципов быстрого самообразования, позволяющие осваивать сложные навыки, получать необходимые знания, максимизировать конкурентные преимущества и выстраивать карьеру. Эти принципы пригодятся всем, кто хочет научиться чему-либо самостоятельно: овладеть языком (или несколькими языками), получить новую профессию или освоить несколько инструментов для создания продукта или бизнеса с нуля. На русском языке публикуется впервые.


Думай о смысле. Будни переводчика IT-текстов

Иван Чаплыгин рассказывает о сложных отношениях внутри пары автор – переводчик. Он позволит заглянуть на переводческую кухню и буквально на пальцах покажет, чем хороший перевод отличается от посредственного и откровенно плохого. Иван расскажет о чувстве слова, неоправданной русификации и переводческих головоломках. О заслуженной критике и необоснованных придирках. А еще о конкуренции среди переводчиков, о поиске заказчиков и об удовольствии от работы. Эта книга поможет вам понять, как находить суть в мутной воде авторского высказывания и как передавать смысл, не искажая оригинал и не привнося в него собственное звучание.


Никаких правил. Уникальная культура Netflix

Книга о корпоративной культуре Netflix, которая построена вокруг свободы и ответственности. Именно культура позволила компании вырасти из небольшой фирмы по прокату DVD в гиганта развлекательной индустрии.


Принципы изменения мирового порядка

Рэй Далио, успешный инвестор и один из самых влиятельных людей планеты, основатель компании Bridgewater, исследует империи прошлого, выявляет закономерности взлетов и падений ведущих мировых экономик и делает выводы относительно настоящего и будущего в сфере макроэкономики и геополитики.