Зачем мы говорим - [68]

Шрифт

Интервал

. На одном из звуковых образцов Обама говорит: «Люди Америки должны обладать великолепной технологией синтезирования речи, и CereProc делает лучшие системы в мире. Поверьте мне, я президент Соединенных Штатов Америки». Синтетический голос звучит немного механически, но, если сказать, что Обама говорит по мобильному телефону, слушатели, возможно, припишут проблемы со звуком телефону, а не голосу. Раньше для такой хитрости потребовался бы опытный пародист, но сегодня специалисты по синтезу речи могут сами играть в подобные игры.

Вызывает беспокойство, что в скором будущем, без сомнения, нас ждут подделки голоса, совершенные злоумышленниками. Мы уже завалены электронными письмами, нацеленными на выуживание информации. Якобы друг пишет, что его ограбили за границей, и срочно просит перевести ему деньги. А теперь представьте, что вам приходит голосовое сообщение, в котором убедительно сымитирован голос вашего друга. Боюсь, что многие, скорее всего, станут жертвами подобной аферы.

Можно использовать технологию и для скрытого редактирования записи речи. Adobe представила инструмент под названием VoCo, который описывают как фотошоп для голоса. Мы уже привыкли, что фотографии можно изменять и подделывать. В будущем нам придется столкнуться с подобным подходом и с записями речи. К сожалению, это даст новые возможности для беспринципных людей, распространяющих дезинформацию.

И хотя возможности искусственных голосов впечатляют, нам все еще далеко до создания робота, сравнимого с Рори Бремнером. Могут ли ученые, занимающиеся синтезом речи, чему-то научиться у профессиональных пародистов? Одно из новейших исследований, изучающих создаваемые голосом впечатления, было проведено командой, в которую входила Софи Скотт, профессор в области когнитивной нейробиологии Университетского колледжа Лондона. Скотт и ее коллеги с помощью фМРТ-сканера измеряли активность мозга у 23 человек в тот момент, когда они исполняли разговорные пародии. Их просили прочитать детские стишки, например «Идут на горку Джек и Джилл», разными голосами. Иногда они говорили обычным голосом, иногда пародировали других людей, например знаменитостей, таких как Шон Коннери, или просто своих друзей ^>{316}. Участвовавшие в исследовании люди не были профессиональными пародистами. Сканирование показало, что, когда их просили кого-то спародировать, участки мозга, связанные с производством и восприятием речи, а также с распознаванием голоса, проявляли повышенную активность. Например, если они пародировали Шона Коннери, то могли сказать «Щекретная шлужба ее величештва», подчеркнуто имитируя необычное произношение звука [с] агентом 007.

У профессиональных пародистов подход совершенно иной. «Я начала заниматься этим вопросом, считая, что профессионалы добиваются нужного звучания, анализируя голос примерно так, как это делают фонетисты», — объясняет Скотт. Но на самом деле они делают нечто совсем иное: «По-видимому, они идут в другом направлении и учитывают буквально все: как человек двигается, что делают его ноздри, брови — похоже, что в изменении голоса задействовано все тело».

Я убедился в этом, когда увидел, как актеры на радио используют определенные гримасы и жесты, чтобы передать особенности голоса, хотя жесты и поведение напрямую никак не влияют на голосовую анатомию. Предварительные результаты этих нейробиологических исследований показывают, что, помимо использования слуховых отделов мозга, профессионалы во время исполнения пародий задействуют визуальные и сенсорные его части ^>{317}. Если это помогает им проникнуть в суть характера, то роботу-актеру, пытающемуся научиться пародировать, потребуется изощренный искусственный интеллект, учитывающий совместную работу зрения, движения и голоса. Однако, несмотря на восторги по поводу достижений искусственного интеллекта, такие успешные эксперименты касаются только очень узких областей, например победы в шахматах. Пока нет даже намека на то, что искусственный интеллект способен объединить знания из разных областей, как это запросто делают люди.

Несомненно, за последние десятилетия искусственные голоса усовершенствовались и стали более естественными. Исследователи применили свои знания реальной речи для развития новых и элегантных математических репрезентаций звука, что улучшило его качество. Но теперь усилия в этой области могут быть заменены грубой силой компьютера.

Алгоритмы машинного обучения в последнее время провоцируют технологическую золотую лихорадку в сфере искусственного интеллекта. Компания DeepMind недавно использовала этот подход для производства синтезированной речи, которая звучит намного лучше, чем все остальные разработки в этой области. По сравнению с другими системами созданный учеными компании голос не такой механический, а интонация более плавная. Он даже воспроизводит некоторые сопутствующие речи звуки, такие как движение рта и дыхание, которые у искусственных голосов обычно отсутствуют. Новый голос далек от совершенства, но настолько хорош, что уже используется в сервисе Google Assistant.

Несмотря на эти достижения в области звука, нас еще долго будут раздражать автоматические голоса, которые сообщают о «неожиданном предмете в зоне выдачи багажа» или советуют «сделать поворот на 180° при первой возможности». Клиффорд Насс, покойный профессор Стэнфордского университета, занимавшийся проблемами коммуникации, полагал, что это чувство раздражения возникает потому, что мы воспринимаем компьютерные голоса как человеческие и оцениваем их достоверность, искренность и особенности характера. В одном исследовании компания BMW обнаружила, что водители предпочитают, чтобы их система спутниковой навигации звучала как компетентный второй пилот-мужчина, а не как командирша на заднем сиденье

Продолжить чтение

Еще от автора Тревор Кокс

Тревор Кокс

Книга звука. Научная одиссея в страну акустических чудес

Тревор Кокс охотится за звуковыми чудесами нашей планеты и наслаждается источниками экзотических звуков — скрипящими ледниками, шепчущими галереями, сталактитовыми орга́нами, музыкальными дорогами, неземными голосами бородатых тюленей и пирамидой майя, чирикающей, словно птица. Обращаясь за помощью к археологии, науке о мозге, биологии и дизайну, Кокс объясняет, как звук формируется и изменяется окружающей средой, как наше тело реагирует на необычные звуки и как эти загадочные чудеса выявляют удивительную динамику звука в повседневной обстановке — от спальни до оперного театра.

Рекомендуем почитать

Роджер Оррит

Получение энергии. Лиза Мейтнер. Расщепление ядра

Женщина, еврейка и ученый — непростая комбинация для бурного XX века. Австрийка по происхождению, Лиза Мейтнер всю жизнь встречала снисходительность и даже презрение со стороны коллег-мужчин и страдала от преследований нацистов. Ее сотрудничество с немецким химиком Отто Ганом продолжалось более трех десятилетий и увенчалось открытием нового элемента — протактиния — и доказательством возможности расщепления ядра. Однако, несмотря на этот вклад, Мейтнер было отказано в Нобелевской премии. Она всегда отстаивала необходимость мирного использования ядерной энергии, в изучении которой сыграла столь заметную роль.

Эдвард Люттвак

Стратегия Византийской империи

Книга Эдварда Н. Люттвака «Стратегия Византийской империи» представляет собою попытку ответить на вопрос о том, почему Византийская – Восточная Римская – империя просуществовала почти вдвое дольше Западной. Этот вопрос уже не раз привлекал внимание историков. Ведь у Византии не было каких-либо особых географических или военных преимуществ по сравнению с Римом, а окружавшие ее народы и племена были не менее могущественны и коварны, чем те, что в течение пятого века нашей эры окончательно разорили Западную империю.

Журнал «Знание-сила»

Знание-сила, 2008 № 10 (976)

Ежемесячный научно-популярный и научно-художественный журнал.

Журнал «Знание-сила»

Знание-сила, 2008 № 07 (973)

Ежемесячный научно-популярный и научно-художественный журнал.

Журнал «Знание-сила»

Знание-сила, 2008 № 06 (972)

Ежемесячный научно-популярный и научно-художественный журнал.

Роман Подольный

Чем мир держится?

В списке исследователей гравитации немало великих имен. И сегодня эту самую слабую и одновременно самую могучую из известных физикам силу взаимодействия исследуют тысячи ученых, ставя тончайшие опыты, выдвигав, остроумные предположения и гипотезы.В книге рассказывается, как эта проблема изучалась в прошлом и как она изучается в настоящее время. Для широкого круга читателей.

Паоло Пелоси

Обоняние

Почему одни запахи кажутся нам чудесными, а другие вызывают отвращение? Есть ли на свете запахи, которые всегда воспринимаются как хорошие или дурные всеми представителями нашего вида – независимо от культуры, прошлого опыта и физиологических различий? Можно ли создать молекулу с каким-то определенным ароматом? А составить ольфакторную карту?.. И кстати, какую роль играют запахи в жизни разных насекомых? Паоло Пелоси, профессор химии, изучающий обоняние, автор более 150 научных публикаций, ответит на все эти и многие другие вопросы, познакомит с новейшими достижениями науки о запахах и расскажет об удивительных механизмах обоняния, которыми эволюция наделила всевозможных живых существ – включая человека. «Мы часто не обращаем внимания на запахи и почти всегда их недооцениваем.

Берндт Хайнрих

Зачем мы бежим, или Как догнать свою антилопу

Бернд Хайнрих – профессор биологии, обладатель мирового рекорда и нескольких рекордов США в марафонских забегах, физиолог, специалист по вопросам терморегуляции и физическим упражнениям. В этой книге он размышляет о спортивном беге как ученый в области естественных наук, рассказывает о своем участии в забеге на 100 километров, положившем начало его карьере в ультрамарафоне, и проводит параллели между человеком и остальным животным миром. Выносливость, интеллект, воля к победе – вот главный девиз бегунов на сверхмарафонские дистанции, способный привести к высочайшим достижениям. «Я утверждаю, что наши способность и страсть к бегу – это наше древнее наследие, сохранившиеся навыки выносливых хищников.

Джеймс Хэмблин

Если бы наши тела могли говорить

Сколько разговоров ведется в СМИ об иммунитете, о том, что нужно больше спать и меньше есть, о кофе, холестерине, витаминах, жирах, вреде смартфонов и пользе БАДов! Что из этого правда, а что – откровенное вранье маркетологов? Доктор медицины и старший редактор The Atlantic Джеймс Хэмблин делится исключительно проверенной научной информацией об особенностях и механизмах функционирования человеческого организма. «Хэмблин пишет с сарказмом, юмором и чувством удивления… Его остроумное исследование о диетах, пищевых добавках, поливитаминах, энергетиках и глютене – невероятно нужная работа.

Мэттью Уолкер

Зачем мы спим

До недавних пор у науки не было полного представления о механизмах сна, о всем многообразии его благотворного влияния и о том, почему последствия хронического недосыпания пагубны для здоровья. Выдающийся невролог и ученый Мэттью Уолкер обобщает данные последних исследований феномена сна и приглашает к разговору на темы, связанные с одним из важнейших аспектов нашего существования. «Сон – это единственное и наиболее эффективное действие, которое мы можем предпринять, чтобы каждый день регулировать работу нашего мозга и тела.