Все лгут. Поисковики, Big Data и Интернет знают о вас всё - [80]
Мы вправе опасаться, что все большее и большее использование онлайн-данных даст казино, страховым компаниям, кредиторам и другим юридическим лицам слишком большую власть над нами.
С другой стороны, большие данные позволяют и потребителям получить определенную компенсацию от предприятий, берущих с них слишком много или поставляющих некачественную продукцию.
Мощное оружие – сайты вроде Yelp, которые публикуют обзоры ресторанов и компаний, предоставляющих различные услуги. Недавнее исследование экономиста Майкла Лука из Гарварда показало, в какой степени те или иные бизнесы пострадали по милости Yelp{184}. Сравнивая отзывы с данными о продажах в штате Вашингтон, он обнаружил: уменьшение числа звезд на Yelp[41] на одну снижает доходы ресторана на 5–9 %.
Потребителям в их борьбе с бизнесом также помогают сайты, сравнивающие торговые площадки и отели – такие, как Kayak и Booking.com. Как обсуждалось во «Фрикономике»[42], когда интернет-сайты начали публиковать отчеты о ценах разных страховых компаний, эти цены резко упали. Если страховщики берут слишком много, клиенты узнают об этом и найдут себе других. Какой оказалась общая экономия для потребителей? Один миллиард долларов в год.
Другими словами, данные в интернете могут подсказать компаниям, каких клиентов стоит избегать, а каких использовать. Они также могут подсказать клиентам, с какими фирмами не стоит связываться, а также какие из них пытаются их, клиентов, использовать. На сегодняшний день большие данные помогают обеим сторонам в борьбе друг с другом. Мы должны убедиться, что борьба по-прежнему честная.
Опасность вооруженных данными правительств
Когда ее бывший бойфренд пришел на вечеринку по поводу дня рождения, Адриана Донато поняла, что он расстроен. Ей показалось, что он сошел с ума. Она знала, что он боролся с депрессией. Когда он пригласил ее покататься на машине, Донато, 20-летняя студентка-зоолог, не знала только одного. Она не знала, что ее бывший бойфренд, 22-летний Джеймс Стоунхэм, предыдущие три недели провел в поисках информации о том, как кого-то убить, и о наказании за убийство, вперемешку с редкими запросами о самой Адриане.
Если бы она знала это, она бы наверняка не села с ним в машину. И, скорее всего, он бы не зарезал ее в тот вечер.
В фильме «Особое мнение» экстрасенсы сотрудничают с полицией, чтобы предотвратить преступления еще до их возникновения. Следует ли для тех же целей предоставить большие данные и отделениям полиции? Нужно ли было по крайней мере предупредить Донато о поисковых запросах ее бывшего бойфренда, а полиции – допросить Стоунхэма?
Во-первых, следует признать: находится все больше доказательств того, что поисковые запросы в Google относительно преступной деятельности напрямую коррелируют с этой самой преступной деятельностью. Кристина Ма-Келламс, Флора Ор, Чжи Хен Баек и Ичиро Кавачи доказали, что количество запросов в Google, связанных с суицидом{185}, сильно коррелирует с количеством самоубийств. Кроме того, мы с Эваном Солтасом обнаружили, что еженедельное число исламофобских поисковых запросов – например, с текстом «я ненавижу мусульман» или «надо убивать мусульман» – напрямую коррелирует с количеством преступлений против мусульман на этой неделе. Если большее число людей выполняет поисковые запросы с сообщением о своем желании что-то сделать, это значит, что большее число людей это сделают.
Так как же нам быть с этой информацией? Есть одна простая и достаточно бесспорная идея: мы можем использовать данные по территориям. Если в каком-то городе сильно растет число поисковых запросов, связанных с самоубийством, мы можем быть уверены в том, что количество суицидов там также возрастет. Значит, местным властям или некоммерческим организациям пора запускать рекламу, объясняя, где люди могут получить психологическую помощь. Аналогично, если в городе сильно возросло число запросов «убивать мусульман», отделениям полиции стоит изменить принцип патрулирования улиц – например, можно направить больше сотрудников к местной мечети.
Но один шаг нам делать не слишком приятно: преследовать людей еще до того, как они совершат преступление. Нам кажется, что это вторжение в частную жизнь. С точки зрения этики, существует большая разница между возможностью правительства собирать информацию о поисковых запросах тысяч или сотен тысяч людей и возможностью полиции записывать аналогичные данные конкретного человека. С точки зрения этики, существует большая разница между защитой местной мечети и возможностью обшарить чужой дом. С точки зрения этики, существует большая разница между рекламой профилактики самоубийств и заключением кого бы то ни было в психиатрическую больницу против его воли.
Однако причина быть предельно осторожными с использованием информации личного характера выходит даже за рамки этики. Она заключается и в самих данных. С точки зрения науки о данных, есть большая разница между попытками предугадать вероятность определенных событий в городе и старанием предсказать действия отдельного человека.
Давайте вернемся к самоубийству. Каждый месяц в США делается около 3,5 миллиона связанных с суицидом поисковых запросов