Убийственные большие данные - [6]

Шрифт
Интервал

А жертвы? Любой специалист по анализу внутренних данных скажет вам, что ни одна статистическая система не может быть идеальной. Жертвы – это сопутствующий риск. И зачастую их признают, как Сару Высоцки, всего лишь расходным материалом. Забудьте о них на минуту, скажут вам, и подумайте обо всех тех людях, которые получили полезные предложения через рекомендации от поисковиков, или нашли любимую музыку на сайте Pandora, или идеальную работу на LinkedIn, или, возможно, встретили любовь всей своей жизни на Match.com. Думайте о впечатляющих масштабах, позабудьте о мелких недостатках.

Большие данные имеют много горячих поклонников, но я к ним не отношусь. Эта книга будет острейшим образом сосредоточена на другом направлении: на том ущербе, который приносит оружие математического поражения, и на несправедливостях, которые оно порождает. Мы исследуем ущерб, который был нанесен людям в критические моменты их жизни: во время поступления в колледж, при попытках взять кредит, при вынесении им приговора в суде, в поисках работы. Все эти жизненно важные рубежи всё в большей и большей степени контролируются тайными моделями, которые произвольно наказывают людей.

Добро пожаловать на темную сторону Больших данных.

Компоненты бомбы: что такое модель?

Стоял жаркий августовский день 1946 года. У Лу Бодро, играющего менеджера команды Cleveland Indians, было отвратительное настроение. В первой из двух игр, намеченных на этот день, Тед Уильямс практически в одиночку уничтожил команду Бодро. Уильямс, возможно лучший хиттер того времени, выбил три хоум-рана и еще довел восемь игроков до домашней базы. В итоге «Индейцы» проиграли со счетом 10:11.

Бодро нужно было что-то предпринять. Поэтому, как только Уильямс вышел на поле во второй игре, игроки «Индейцев» начали быстро перемещаться. Бодро, шорт-стоп, перебежал на место, где обычно стоял второй бейсмен, а второй бейсмен отошел на правый аутфилд, третий бейсмен сдвинулся влево, к месту шорт-стопа. Было очевидно, что Бодро (возможно, эта идея была продиктована отчаянием) полностью изменил расположение своей защиты, чтобы превратить хиты Теда Уильямса в ауты.

Другими словами, Бодро мыслил как специалист по анализу данных. Он проанализировал предварительные данные, по большей части на основе наблюдений: обычно Тед Уильямс делал подачу в правый аутфилд. Затем он предпринял меры – и они сработали. Игроки стали ловить больше мощных лайнеров Уильямса (хотя они по-прежнему ничего не могли сделать с хоум-ранами, пролетающими над их головами).

Если вы сегодня придете на бейсбольную игру высшей лиги, вы увидите, что защита относится практически к каждому игроку противника как к Теду Уильямсу. Если Бодро просто пронаблюдал за тем, куда Уильямс обычно направлял удар, то сейчас менеджеры точно знают, куда каждый игрок направлял удар в течение последней недели, за последний месяц, за всю карьеру, играя против левшей, в ситуации, когда у него было два страйка, и так далее и тому подобное. Используя эту собранную информацию, они могут проанализировать текущую ситуацию и рассчитать расстановку игроков, дающую наибольшую вероятность успеха. Иногда это включает в себя довольно-таки существенные перемещения игроков по полю.

Перенос защиты – лишь часть гораздо более серьезного вопроса: какие шаги могут предпринять бейсбольные команды для максимизации вероятности победы? В поисках ответа на этот вопрос специалисты по бейсбольной статистике изучили каждую переменную, которую смогли количественно измерить, и присвоили ей определенную ценность. Насколько дабл ценнее сингла? Когда, если вообще когда-либо, имеет смысл использовать сэкрифайс-бант для перемещения раннера с первой на вторую базу?

Ответы на все эти вопросы смешаны и объединены в математические модели этого спорта. В мире бейсбола существуют параллельные вселенные, и каждая из них представляет собой сложное вероятностное полотно. Они включат в себя каждое измеримое отношение между каждым спортивным компонентом, от уоков и хоум-ранов и до самих игроков. Цель модели – просчитать разные сценарии на каждой развилке и найти оптимальные комбинации. Если Yankees поставят питчера-правшу против сильного отбивающего Майка Траута из Angels, в сравнении с их текущим питчером – кто с большой вероятностью его выбьет? И как это повлияет на общую вероятность победы?

Бейсбол – идеальная база для предиктивного математического моделирования. Как писал Майкл Льюис в своем бестселлере Moneyball (2003)[1], этот спорт привлекал самых увлеченных аналитиков данных на протяжении всей его истории. В прошлом фанаты изучали статистику по оборотным сторонам бейсбольных карточек, анализируя закономерности хоум-ранов Карла Ястржемски или сравнивая общее количество страйк-аутов Роджера Клеменса и Дуайта Гудена. Но начиная с 1980-х годов за дело взялись серьезные специалисты по статистике – они начали разбираться, что же, собственно, означают все эти цифры вместе с огромным количеством новых данных: как именно они конвертируются в победы и как руководство команды может достичь максимального успеха при минимальных вложениях.


Рекомендуем почитать
Гражданственность и гражданское общество

В монографии на социологическом и культурно-историческом материале раскрывается сущность гражданского общества и гражданственности как культурно и исторически обусловленных форм самоорганизации, способных выступать в качестве социального ресурса управляемости в обществе и средства поддержания социального порядка. Рассчитана на научных работников, занимающихся проблемами социологии и политологии, служащих органов государственного управления и всех интересующихся проблемами самоорганизации и самоуправления в обществе.


Уклоны, загибы и задвиги в русском движении

Перед Вами – сборник статей, посвящённых Русскому национальному движению – научное исследование, проведённое учёным, писателем, публицистом, социологом и политологом Александром Никитичем СЕВАСТЬЯНОВЫМ, выдвинувшимся за последние пятнадцать лет на роль главного выразителя и пропагандиста Русской национальной идеи. Для широкого круга читателей. НАУЧНОЕ ИЗДАНИЕ Рекомендовано для факультативного изучения студентам всех гуманитарных вузов Российской Федерации и стран СНГ.


Классовая борьба. Государство и капитал

Книга дает марксистский ключ к пониманию политики и истории. В развитие классической «двуполярной» диалектики рассматривается новая методология: борьба трех отрицающих друг друга противоположностей. Новая классовая теория ясно обозначает треугольник: рабочие/коммунисты — буржуазия/либералы — чиновники/государство. Ставится вопрос о новой форме эксплуатации трудящихся: государством. Бюрократия разоблачается как самостоятельный эксплуататорский класс. Показана борьба между тремя классами общества за обладание политической, государственной властью.


Счастливый клевер человечества: Всеобщая история открытий, технологий, конкуренции и богатства

Почему одни страны развиваются быстрее и успешнее, чем другие? Есть ли универсальная формула успеха, и если да, какие в ней переменные? Отвечая на эти вопросы, автор рассматривает историю человечества, начиная с отделения человека от животного стада и первых цивилизаций до наших дней, и выделяет из нее важные факты и закономерности.Четыре элемента отличали во все времена успешные общества от неуспешных: знания, их интеграция в общество, организация труда и обращение денег. Модель счастливого клевера – так называет автор эти четыре фактора – поможет вам по-новому взглянуть на историю, современную мировую экономику, технологии и будущее, а также оценить шансы на успех разных народов и стран.


Нации и этничность в гуманитарных науках. Этнические, протонациональные и национальные нарративы. Формирование и репрезентация

Издание включает в себя материалы второй международной конференции «Этнические, протонациональные и национальные нарративы: формирование и репрезентация» (Санкт-Петербургский государственный университет, 24–26 февраля 2015 г.). Сборник посвящен многообразию нарративов и их инструментальным возможностям в различные периоды от Средних веков до Новейшего времени. Подобный широкий хронологический и географический охват обуславливается перспективой выявления универсальных сценариев конструирования и репрезентации нарративов.Для историков, политологов, социологов, филологов и культурологов, а также интересующихся проблемами этничности и национализма.


Геноцид белой расы. Кризис Европы. Как спастись, как преуспеть

100 лет назад Шпенглер предсказывал закат Европы к началу XXI века. Это и происходит сейчас. Европейцев становится все меньше, в Париже арабов больше, чем коренных парижан. В России картина тоже безрадостная: падение культуры, ухудшение здоровья и снижение интеллекта у молодежи, рост наркомании, алкоголизма, распад семьи.Кто виноват и в чем причины социальной катастрофы? С чего начинается заболевание общества и в чем его первопричина? Как нам выжить и сохранить свой генофонд? Как поддержать величие русского народа и прийти к великому будущему? Как добиться процветания и счастья?На эти и многие другие важнейшие вопросы даст ответы книга, которую вы держите в руках.