Убийственные большие данные - [6]

Шрифт
Интервал

А жертвы? Любой специалист по анализу внутренних данных скажет вам, что ни одна статистическая система не может быть идеальной. Жертвы – это сопутствующий риск. И зачастую их признают, как Сару Высоцки, всего лишь расходным материалом. Забудьте о них на минуту, скажут вам, и подумайте обо всех тех людях, которые получили полезные предложения через рекомендации от поисковиков, или нашли любимую музыку на сайте Pandora, или идеальную работу на LinkedIn, или, возможно, встретили любовь всей своей жизни на Match.com. Думайте о впечатляющих масштабах, позабудьте о мелких недостатках.

Большие данные имеют много горячих поклонников, но я к ним не отношусь. Эта книга будет острейшим образом сосредоточена на другом направлении: на том ущербе, который приносит оружие математического поражения, и на несправедливостях, которые оно порождает. Мы исследуем ущерб, который был нанесен людям в критические моменты их жизни: во время поступления в колледж, при попытках взять кредит, при вынесении им приговора в суде, в поисках работы. Все эти жизненно важные рубежи всё в большей и большей степени контролируются тайными моделями, которые произвольно наказывают людей.

Добро пожаловать на темную сторону Больших данных.

Компоненты бомбы: что такое модель?

Стоял жаркий августовский день 1946 года. У Лу Бодро, играющего менеджера команды Cleveland Indians, было отвратительное настроение. В первой из двух игр, намеченных на этот день, Тед Уильямс практически в одиночку уничтожил команду Бодро. Уильямс, возможно лучший хиттер того времени, выбил три хоум-рана и еще довел восемь игроков до домашней базы. В итоге «Индейцы» проиграли со счетом 10:11.

Бодро нужно было что-то предпринять. Поэтому, как только Уильямс вышел на поле во второй игре, игроки «Индейцев» начали быстро перемещаться. Бодро, шорт-стоп, перебежал на место, где обычно стоял второй бейсмен, а второй бейсмен отошел на правый аутфилд, третий бейсмен сдвинулся влево, к месту шорт-стопа. Было очевидно, что Бодро (возможно, эта идея была продиктована отчаянием) полностью изменил расположение своей защиты, чтобы превратить хиты Теда Уильямса в ауты.

Другими словами, Бодро мыслил как специалист по анализу данных. Он проанализировал предварительные данные, по большей части на основе наблюдений: обычно Тед Уильямс делал подачу в правый аутфилд. Затем он предпринял меры – и они сработали. Игроки стали ловить больше мощных лайнеров Уильямса (хотя они по-прежнему ничего не могли сделать с хоум-ранами, пролетающими над их головами).

Если вы сегодня придете на бейсбольную игру высшей лиги, вы увидите, что защита относится практически к каждому игроку противника как к Теду Уильямсу. Если Бодро просто пронаблюдал за тем, куда Уильямс обычно направлял удар, то сейчас менеджеры точно знают, куда каждый игрок направлял удар в течение последней недели, за последний месяц, за всю карьеру, играя против левшей, в ситуации, когда у него было два страйка, и так далее и тому подобное. Используя эту собранную информацию, они могут проанализировать текущую ситуацию и рассчитать расстановку игроков, дающую наибольшую вероятность успеха. Иногда это включает в себя довольно-таки существенные перемещения игроков по полю.

Перенос защиты – лишь часть гораздо более серьезного вопроса: какие шаги могут предпринять бейсбольные команды для максимизации вероятности победы? В поисках ответа на этот вопрос специалисты по бейсбольной статистике изучили каждую переменную, которую смогли количественно измерить, и присвоили ей определенную ценность. Насколько дабл ценнее сингла? Когда, если вообще когда-либо, имеет смысл использовать сэкрифайс-бант для перемещения раннера с первой на вторую базу?

Ответы на все эти вопросы смешаны и объединены в математические модели этого спорта. В мире бейсбола существуют параллельные вселенные, и каждая из них представляет собой сложное вероятностное полотно. Они включат в себя каждое измеримое отношение между каждым спортивным компонентом, от уоков и хоум-ранов и до самих игроков. Цель модели – просчитать разные сценарии на каждой развилке и найти оптимальные комбинации. Если Yankees поставят питчера-правшу против сильного отбивающего Майка Траута из Angels, в сравнении с их текущим питчером – кто с большой вероятностью его выбьет? И как это повлияет на общую вероятность победы?

Бейсбол – идеальная база для предиктивного математического моделирования. Как писал Майкл Льюис в своем бестселлере Moneyball (2003)[1], этот спорт привлекал самых увлеченных аналитиков данных на протяжении всей его истории. В прошлом фанаты изучали статистику по оборотным сторонам бейсбольных карточек, анализируя закономерности хоум-ранов Карла Ястржемски или сравнивая общее количество страйк-аутов Роджера Клеменса и Дуайта Гудена. Но начиная с 1980-х годов за дело взялись серьезные специалисты по статистике – они начали разбираться, что же, собственно, означают все эти цифры вместе с огромным количеством новых данных: как именно они конвертируются в победы и как руководство команды может достичь максимального успеха при минимальных вложениях.


Рекомендуем почитать
Почему у женщин при социализме секс лучше

Профессор Пенсильванского университета, автор семи книг Кристен Годси объясняет, почему триумф капитализма в странах первого и второго мира не стал выходом для большинства женщин. Она мастерски развенчивает устойчивые мифы о том, что в условиях свободного рынка у женщин больше возможностей достичь карьерных высот и экономической независимости, внутреннего равновесия и личного счастья. На множестве примеров Кристен Годси показывает, как, дискриминируя женщин, капитализм во всем обделяет их – от физических радостей до интеллектуальной самореализации – и использует в интересах процветания тех, кто уже находится на вершине экономической пирамиды. Несмотря на крах и идейную дискредитацию социализма в странах Восточной Европы, Годси убеждена, что многие элементы социалистической экономики способны обеспечить женщине условия для развития и полноправного труда, здоровое распределение сил между работой и семьей и в конечном итоге гармоничные и насыщенные сексуальные отношения.


Иран vs Ирак: история и современность

В монографии рассматриваются проблемы развития взаимосвязей между персами и арабами, генезис и современное состояние ирано-иракских отношений. Автор прослеживает процесс зарождения исламской цивилизации, характер арабских завоевательных походов, исторические судьбы мусульманских народов в Средние века, ход Новой и Новейшей истории Ирана и Ирака. Анализируются истоки противоречий, которые приводят к конфликтным ситуациям на Ближнем и Среднем Востоке. Для специалистов-историков, преподавателей и студентов, всех интересующихся живой историей Востока.


Виртуальные войны. Фейки

Вместе с Интернетом и социальными медиа в наш мир пришли виртуальные войны и фейки. Иногда они становились важным фактором политики. Это были российские информационные вмешательства в американские и французские президентские выборы и референдумы (Брекзит и Каталония). Сегодняшний мир перешел не только от правды к постправде, но и от фейка к постфейку. Виртуальные войны представляют собой войны без применения оружия. Это делает возможным их применение не только во время войны, но и в мирный период. Виртуальные войны формируют сознание людей, что приводит к трансформации их поведения.


Прогнозы постбольшевистского устройства России в эмигрантской историографии (20–30-е гг. XX в.)

В монографии рассмотрены прогнозы видных представителей эмигрантской историографии (Г. П. Федотова, Ф. А. Степуна, В. А. Маклакова, Б. А. Бахметева, Н. С. Тимашева и др.) относительно преобразований политической, экономической, культурной и религиозной жизни постбольшевистской России. Примененный автором личностный подход позволяет выявить индивидуальные черты изучаемого мыслителя, определить атмосферу, в которой формировались его научные взгляды и проходила их эволюция. В книге раскрыто отношение ученых зарубежья к проблемам Советской России, к методам и формам будущих преобразований.


Капиталистическое отчуждение труда и кризис современной цивилизации

В монографии исследуются эволюция капиталистического отчуждения труда в течение последних ста лет, возникновение новых форм отчуждения, влияние растущего отчуждения на развитие образования, науки, культуры, личности. Исследование основывается на материалах философских, социологических и исторических работ.


Современный расизм как он есть

Сборник показывает на обширном документальном материале современные проявления расизма в различных странах так называемого «свободного мира» и в империалистической политике на международной арене в целом.Авторы книги раскрывают перед читателями страницы борьбы народов против расовой дискриминации, в частности против сионизма, тесно связанного с реакционной политикой империализма.Во второе издание книги включены новые документы, относящиеся к 80-м годам.Адресуется широкому кругу читателей.