Зачем мы говорим - [68]

Шрифт
Интервал

. На одном из звуковых образцов Обама говорит: «Люди Америки должны обладать великолепной технологией синтезирования речи, и CereProc делает лучшие системы в мире. Поверьте мне, я президент Соединенных Штатов Америки». Синтетический голос звучит немного механически, но, если сказать, что Обама говорит по мобильному телефону, слушатели, возможно, припишут проблемы со звуком телефону, а не голосу. Раньше для такой хитрости потребовался бы опытный пародист, но сегодня специалисты по синтезу речи могут сами играть в подобные игры.

Вызывает беспокойство, что в скором будущем, без сомнения, нас ждут подделки голоса, совершенные злоумышленниками. Мы уже завалены электронными письмами, нацеленными на выуживание информации. Якобы друг пишет, что его ограбили за границей, и срочно просит перевести ему деньги. А теперь представьте, что вам приходит голосовое сообщение, в котором убедительно сымитирован голос вашего друга. Боюсь, что многие, скорее всего, станут жертвами подобной аферы.

Можно использовать технологию и для скрытого редактирования записи речи. Adobe представила инструмент под названием VoCo, который описывают как фотошоп для голоса. Мы уже привыкли, что фотографии можно изменять и подделывать. В будущем нам придется столкнуться с подобным подходом и с записями речи. К сожалению, это даст новые возможности для беспринципных людей, распространяющих дезинформацию.

И хотя возможности искусственных голосов впечатляют, нам все еще далеко до создания робота, сравнимого с Рори Бремнером. Могут ли ученые, занимающиеся синтезом речи, чему-то научиться у профессиональных пародистов? Одно из новейших исследований, изучающих создаваемые голосом впечатления, было проведено командой, в которую входила Софи Скотт, профессор в области когнитивной нейробиологии Университетского колледжа Лондона. Скотт и ее коллеги с помощью фМРТ-сканера измеряли активность мозга у 23 человек в тот момент, когда они исполняли разговорные пародии. Их просили прочитать детские стишки, например «Идут на горку Джек и Джилл», разными голосами. Иногда они говорили обычным голосом, иногда пародировали других людей, например знаменитостей, таких как Шон Коннери, или просто своих друзей >{316}. Участвовавшие в исследовании люди не были профессиональными пародистами. Сканирование показало, что, когда их просили кого-то спародировать, участки мозга, связанные с производством и восприятием речи, а также с распознаванием голоса, проявляли повышенную активность. Например, если они пародировали Шона Коннери, то могли сказать «Щекретная шлужба ее величештва», подчеркнуто имитируя необычное произношение звука [с] агентом 007.

У профессиональных пародистов подход совершенно иной. «Я начала заниматься этим вопросом, считая, что профессионалы добиваются нужного звучания, анализируя голос примерно так, как это делают фонетисты», — объясняет Скотт. Но на самом деле они делают нечто совсем иное: «По-видимому, они идут в другом направлении и учитывают буквально все: как человек двигается, что делают его ноздри, брови — похоже, что в изменении голоса задействовано все тело».

Я убедился в этом, когда увидел, как актеры на радио используют определенные гримасы и жесты, чтобы передать особенности голоса, хотя жесты и поведение напрямую никак не влияют на голосовую анатомию. Предварительные результаты этих нейробиологических исследований показывают, что, помимо использования слуховых отделов мозга, профессионалы во время исполнения пародий задействуют визуальные и сенсорные его части >{317}. Если это помогает им проникнуть в суть характера, то роботу-актеру, пытающемуся научиться пародировать, потребуется изощренный искусственный интеллект, учитывающий совместную работу зрения, движения и голоса. Однако, несмотря на восторги по поводу достижений искусственного интеллекта, такие успешные эксперименты касаются только очень узких областей, например победы в шахматах. Пока нет даже намека на то, что искусственный интеллект способен объединить знания из разных областей, как это запросто делают люди.


Несомненно, за последние десятилетия искусственные голоса усовершенствовались и стали более естественными. Исследователи применили свои знания реальной речи для развития новых и элегантных математических репрезентаций звука, что улучшило его качество. Но теперь усилия в этой области могут быть заменены грубой силой компьютера.

Алгоритмы машинного обучения в последнее время провоцируют технологическую золотую лихорадку в сфере искусственного интеллекта. Компания DeepMind недавно использовала этот подход для производства синтезированной речи, которая звучит намного лучше, чем все остальные разработки в этой области. По сравнению с другими системами созданный учеными компании голос не такой механический, а интонация более плавная. Он даже воспроизводит некоторые сопутствующие речи звуки, такие как движение рта и дыхание, которые у искусственных голосов обычно отсутствуют. Новый голос далек от совершенства, но настолько хорош, что уже используется в сервисе Google Assistant.

Несмотря на эти достижения в области звука, нас еще долго будут раздражать автоматические голоса, которые сообщают о «неожиданном предмете в зоне выдачи багажа» или советуют «сделать поворот на 180° при первой возможности». Клиффорд Насс, покойный профессор Стэнфордского университета, занимавшийся проблемами коммуникации, полагал, что это чувство раздражения возникает потому, что мы воспринимаем компьютерные голоса как человеческие и оцениваем их достоверность, искренность и особенности характера. В одном исследовании компания BMW обнаружила, что водители предпочитают, чтобы их система спутниковой навигации звучала как компетентный второй пилот-мужчина, а не как командирша на заднем сиденье


Еще от автора Тревор Кокс
Книга звука. Научная одиссея в страну акустических чудес

Тревор Кокс охотится за звуковыми чудесами нашей планеты и наслаждается источниками экзотических звуков — скрипящими ледниками, шепчущими галереями, сталактитовыми орга́нами, музыкальными дорогами, неземными голосами бородатых тюленей и пирамидой майя, чирикающей, словно птица. Обращаясь за помощью к археологии, науке о мозге, биологии и дизайну, Кокс объясняет, как звук формируется и изменяется окружающей средой, как наше тело реагирует на необычные звуки и как эти загадочные чудеса выявляют удивительную динамику звука в повседневной обстановке — от спальни до оперного театра.


Рекомендуем почитать
Дьявольский ген

Оказалось, достаточно всего одного поколения медиков, чтобы полностью изменить взгляд на генетические заболевания. Когда-то они воспринимались как удар судьбы, а сейчас во многих случаях с ними можно справиться. Некоторые из них почти исчезли, как, например, талассемия, отступившая на Кипре благодаря определенным политическим мерам, или болезнь Тея–Сакса, все менее распространенная у евреев-ашкеназов. Случаи заболевания муковисцидозом также сократились. Генетические заболевания похожи на родовое проклятие, то появляющееся, то исчезающее от поколения к поколению.


Стареть, не старея. О жизненной активности и старении

Книга Рюди Вестендорпа, профессора геронтологии Лейденского университета и директора Лейденской академии жизненной активности и старения, анализирует процесс старения и его причины в широком аспекте современных научных знаний. Чему мы можем научиться от людей, которые оставались здоровыми всю свою исключительно долгую жизнь? Помогут ли нам ограничения в пище или гормоны, витамины и минеральные вещества? Как сохранить свои жизненные силы, несмотря на лишения и болезни? Автор систематизирует факторы, влияющие на постоянно растущую продолжительность жизни людей нашего времени. В книге подробно обсуждаются социальные и политические последствия этого жизненного взрыва.


Динозавры. 150 000 000 лет господства на Земле

Если вы читали о динозаврах в детстве, смотрели «Мир юрского периода» и теперь думаете, что все о них знаете, – в этой книге вас ждет много сюрпризов. Начиная c описания мегалозавра в XIX в. и заканчивая открытиями 2017 г., ученые Даррен Нэйш и Пол Барретт рассказывают о том, что сегодня известно палеонтологам об этих животных, и о том, как компьютерное моделирование, томографы и другие новые технологии помогают ученым узнать еще больше. Перед вами развернется история длиной в 150 миллионов лет – от первых существ размером с кошку до тираннозавра и дальше к современным ястребам и колибри.


История девяти сюжетов

В книге в занимательной форме рассказывается об истории создания девяти известных литературных произведений: от жизненного факта, положенного в основу, до литературного воплощения.


Как стать популярным автором

Месяцы сочинительства и переделок написанного, мыканья по издательствам, кропотливой работы по продвижению собственной книги — так начиналась карьера бизнес-автора Екатерины Иноземцевой. Спустя три года в школе писательства, основанной Екатериной, обучались 1287 учеников, родилось 2709 статей, 1756 из которых опубликовали крупные СМИ. И главное: каждый из выпускников получил знания о том, как писательство помогает развить личный бренд. В этой книге — опыт автора в создании полезного и интересного контента, взаимодействия со СМИ и поиска вашего кода популярности.


Тайны, догадки, прозрения

В книге рассказывается, как родилась и развивалась физиология высшей нервной деятельности, какие непостижимые прежде тайны были раскрыты познанием за сто с лишним лет существования этой науки. И о том, как в результате проникновения физиологии в духовную, психическую деятельность человека, на стыке физиологии и математики родилась новая наука — кибернетика.


Зачем мы бежим, или Как догнать свою антилопу

Бернд Хайнрих – профессор биологии, обладатель мирового рекорда и нескольких рекордов США в марафонских забегах, физиолог, специалист по вопросам терморегуляции и физическим упражнениям. В этой книге он размышляет о спортивном беге как ученый в области естественных наук, рассказывает о своем участии в забеге на 100 километров, положившем начало его карьере в ультрамарафоне, и проводит параллели между человеком и остальным животным миром. Выносливость, интеллект, воля к победе – вот главный девиз бегунов на сверхмарафонские дистанции, способный привести к высочайшим достижениям. «Я утверждаю, что наши способность и страсть к бегу – это наше древнее наследие, сохранившиеся навыки выносливых хищников.


Гастрофизика. Новая наука о питании

Удовольствие от еды, впечатление от блюда или напитка формируется не во рту, а в голове, утверждают современные ученые. Нашим пищевым поведением управляют все органы чувств сразу. Кроме вкуса, запаха и текстуры блюда или напитка, на нас влияют фоновые звуки и музыка, которая играет в ресторане или дома, погода за окном, форма и цвет посуды, вес столовых приборов, компания, собравшаяся за столом… Чарльз Спенс подробно исследует все эти феномены, рассказывая, как сделать трапезу приятной, пробуждающей воображение, оставляющей приятные воспоминания.


Если бы наши тела могли говорить

Сколько разговоров ведется в СМИ об иммунитете, о том, что нужно больше спать и меньше есть, о кофе, холестерине, витаминах, жирах, вреде смартфонов и пользе БАДов! Что из этого правда, а что – откровенное вранье маркетологов? Доктор медицины и старший редактор The Atlantic Джеймс Хэмблин делится исключительно проверенной научной информацией об особенностях и механизмах функционирования человеческого организма. «Хэмблин пишет с сарказмом, юмором и чувством удивления… Его остроумное исследование о диетах, пищевых добавках, поливитаминах, энергетиках и глютене – невероятно нужная работа.


Зачем мы спим

До недавних пор у науки не было полного представления о механизмах сна, о всем многообразии его благотворного влияния и о том, почему последствия хронического недосыпания пагубны для здоровья. Выдающийся невролог и ученый Мэттью Уолкер обобщает данные последних исследований феномена сна и приглашает к разговору на темы, связанные с одним из важнейших аспектов нашего существования. «Сон – это единственное и наиболее эффективное действие, которое мы можем предпринять, чтобы каждый день регулировать работу нашего мозга и тела.