Убийственные большие данные - [7]

Шрифт
Интервал

Сегодня термин moneyball («денежный мяч») служит условным обозначением любого статистического подхода в областях, где в течение долгого времени господствовала исключительно интуиция. Но пример бейсбола – это пример здорового анализа, который я привела для контраста с более токсичными примерами анализа, которые я считаю действием ОМП и которые появляются во все большем количестве областей нашей жизни. Бейсбольные модели справедливы, в частности, из-за своей прозрачности. Любой человек располагает доступом к статистике и может более или менее понять, как она интерпретируется. Да, конечно, модель одной команды может придавать больше ценности хоум-раннерам, в то время как другие могут их слегка недооценивать из-за того, что сильные отбивающие имеют тенденцию к большому количеству страйк-аутов. Но в любом случае информация о числе хоум-ранов и страйк-аутов доступна для всех интересующихся.

Кроме того, в бейсболе есть статистическая строгость. Его гуру располагают огромным количеством информации, и практически вся она напрямую касается манеры игроков. Более того, эта информация имеет непосредственное отношение к результатам, которые эти гуру пытаются предсказать. Это может показаться очевидным, но, как мы увидим на страницах этой книги, люди, создающие оружие математического поражения, испытывают постоянный дефицит информации как раз о тех типах поведения, которые их больше всего интересуют. В результате они подставляют вместо информации ее подмену (прокси). Они проводят статистические корреляции между чьим-то почтовым кодом или манерой речи и способностью этого человека выплатить кредит или справиться с рабочими обязанностями. Эти корреляции дискриминационны, а некоторые из них и незаконны. Бейсбольные модели по большей части не используют прокси из-за того, что они располагают фактической информацией: мячами, страйками и хитами.

Но самое главное – поток этой информации постоянно обновляется благодаря статистике, собираемой с 12–13 игр ежедневно с апреля по октябрь. Специалисты по статистике могут сравнить результаты этих игр с предсказаниями своих моделей – и увидеть, где они были не правы. Возможно, они предсказали, что реливер-левша пропустит много хитов от бэттеров-правшей – а он в результате их разгромил. В этом случае статистики пытаются подправить свою модель и пристально изучают, как и почему они ошиблись. Возможно, это новый крученый мяч питчера повлиял на их статистику? Или этот питчер лучше играет по вечерам? Все, что они узнают, они снова загрузят в модель, чтобы еще тоньше настроить ее. Именно так работают модели, заслуживающие доверия. Они постоянно взаимодействуют с миром, который они пытаются понять или предсказать. Если условия меняются – модель должна меняться вместе с ними.

Посмотрев сейчас на бейсбольную модель с ее тысячами переменных, вы можете задуматься: как вообще можно сравнивать ее с моделью, использованной для оценки учителей в школах Вашингтона? Первая моделирует спортивную игру в мельчайших деталях и постоянно обновляется. Вторая, при всей ее таинственности, опирается из года в год на результаты горстки тестов. Можно ли вообще называть ее моделью?

Ответ – да. Любая модель, в конце концов, есть не что иное, как абстрактное представление какого-то процесса, будь то бейсбольная игра, цепочка поставщиков нефтяной компании, действия иностранного правительства или посещаемость кинотеатра. Загружена ли она в компьютерную программу или хранится в нашей голове, модель берет наши знания и использует их для того, чтобы предсказать будущие результаты процесса в разных ситуациях. Все мы держим в уме тысячи моделей. Они подсказывают, чего нам ожидать, и руководят нашими действиями.

Вот неформальная модель, которую я использую ежедневно. Будучи мамой троих детей, я сама готовлю еду – мой муж, милейший человек, каждый раз забывает посолить макароны. Каждый вечер, когда я начинаю готовить ужин на всю семью, я внутренне и интуитивно моделирую аппетит каждого домочадца. Я знаю, что один из сыновей любит курицу (но ненавидит гамбургеры), а другой ест только пасту (с дополнительной порцией тертого пармезана). Но я также принимаю во внимание то, что их аппетиты меняются в разные дни – поэтому в мою модель может вкрасться ошибка. В ней всегда будет неизбежный элемент неопределенности.

В мою модель вкладывается информация о моей семье, об ингредиентах, которые у меня уже имеются или мне доступны, а также моей собственной энергии, времени и амбициях. На выходе я получаю решение, что и как мне приготовить. Я оцениваю успех ужина степенью удовлетворенности моей семьи, а также количеством съеденного и тем, насколько еда была здоровой. То, насколько хорошо принимают приготовленную мной еду и сколько ее съедают, позволяет мне обновить свою модель к следующему приготовлению ужина. Обновления и уточнения делают модель динамической – так это называется в статистике.

С гордостью могу сказать, что со временем я научилась очень неплохо готовить для своей семьи. Но представьте, что нам с мужем нужно уехать на неделю, а мне понадобится объяснить свою модель моей маме, чтобы она смогла меня заменить? Или если моя многодетная подруга заинтересовалась моим подходом? В этот момент я попытаюсь придать моей модели какие-то более формальные черты, сделать ее более систематической – и, в каком-то смысле, более математической. Если у меня хватит амбиций, я даже могу создать на ее основе компьютерную программу.


Рекомендуем почитать
Почему у женщин при социализме секс лучше

Профессор Пенсильванского университета, автор семи книг Кристен Годси объясняет, почему триумф капитализма в странах первого и второго мира не стал выходом для большинства женщин. Она мастерски развенчивает устойчивые мифы о том, что в условиях свободного рынка у женщин больше возможностей достичь карьерных высот и экономической независимости, внутреннего равновесия и личного счастья. На множестве примеров Кристен Годси показывает, как, дискриминируя женщин, капитализм во всем обделяет их – от физических радостей до интеллектуальной самореализации – и использует в интересах процветания тех, кто уже находится на вершине экономической пирамиды. Несмотря на крах и идейную дискредитацию социализма в странах Восточной Европы, Годси убеждена, что многие элементы социалистической экономики способны обеспечить женщине условия для развития и полноправного труда, здоровое распределение сил между работой и семьей и в конечном итоге гармоничные и насыщенные сексуальные отношения.


Иран vs Ирак: история и современность

В монографии рассматриваются проблемы развития взаимосвязей между персами и арабами, генезис и современное состояние ирано-иракских отношений. Автор прослеживает процесс зарождения исламской цивилизации, характер арабских завоевательных походов, исторические судьбы мусульманских народов в Средние века, ход Новой и Новейшей истории Ирана и Ирака. Анализируются истоки противоречий, которые приводят к конфликтным ситуациям на Ближнем и Среднем Востоке. Для специалистов-историков, преподавателей и студентов, всех интересующихся живой историей Востока.


Виртуальные войны. Фейки

Вместе с Интернетом и социальными медиа в наш мир пришли виртуальные войны и фейки. Иногда они становились важным фактором политики. Это были российские информационные вмешательства в американские и французские президентские выборы и референдумы (Брекзит и Каталония). Сегодняшний мир перешел не только от правды к постправде, но и от фейка к постфейку. Виртуальные войны представляют собой войны без применения оружия. Это делает возможным их применение не только во время войны, но и в мирный период. Виртуальные войны формируют сознание людей, что приводит к трансформации их поведения.


Прогнозы постбольшевистского устройства России в эмигрантской историографии (20–30-е гг. XX в.)

В монографии рассмотрены прогнозы видных представителей эмигрантской историографии (Г. П. Федотова, Ф. А. Степуна, В. А. Маклакова, Б. А. Бахметева, Н. С. Тимашева и др.) относительно преобразований политической, экономической, культурной и религиозной жизни постбольшевистской России. Примененный автором личностный подход позволяет выявить индивидуальные черты изучаемого мыслителя, определить атмосферу, в которой формировались его научные взгляды и проходила их эволюция. В книге раскрыто отношение ученых зарубежья к проблемам Советской России, к методам и формам будущих преобразований.


Капиталистическое отчуждение труда и кризис современной цивилизации

В монографии исследуются эволюция капиталистического отчуждения труда в течение последних ста лет, возникновение новых форм отчуждения, влияние растущего отчуждения на развитие образования, науки, культуры, личности. Исследование основывается на материалах философских, социологических и исторических работ.


Современный расизм как он есть

Сборник показывает на обширном документальном материале современные проявления расизма в различных странах так называемого «свободного мира» и в империалистической политике на международной арене в целом.Авторы книги раскрывают перед читателями страницы борьбы народов против расовой дискриминации, в частности против сионизма, тесно связанного с реакционной политикой империализма.Во второе издание книги включены новые документы, относящиеся к 80-м годам.Адресуется широкому кругу читателей.