Убийственные большие данные - [7]

Шрифт
Интервал

Сегодня термин moneyball («денежный мяч») служит условным обозначением любого статистического подхода в областях, где в течение долгого времени господствовала исключительно интуиция. Но пример бейсбола – это пример здорового анализа, который я привела для контраста с более токсичными примерами анализа, которые я считаю действием ОМП и которые появляются во все большем количестве областей нашей жизни. Бейсбольные модели справедливы, в частности, из-за своей прозрачности. Любой человек располагает доступом к статистике и может более или менее понять, как она интерпретируется. Да, конечно, модель одной команды может придавать больше ценности хоум-раннерам, в то время как другие могут их слегка недооценивать из-за того, что сильные отбивающие имеют тенденцию к большому количеству страйк-аутов. Но в любом случае информация о числе хоум-ранов и страйк-аутов доступна для всех интересующихся.

Кроме того, в бейсболе есть статистическая строгость. Его гуру располагают огромным количеством информации, и практически вся она напрямую касается манеры игроков. Более того, эта информация имеет непосредственное отношение к результатам, которые эти гуру пытаются предсказать. Это может показаться очевидным, но, как мы увидим на страницах этой книги, люди, создающие оружие математического поражения, испытывают постоянный дефицит информации как раз о тех типах поведения, которые их больше всего интересуют. В результате они подставляют вместо информации ее подмену (прокси). Они проводят статистические корреляции между чьим-то почтовым кодом или манерой речи и способностью этого человека выплатить кредит или справиться с рабочими обязанностями. Эти корреляции дискриминационны, а некоторые из них и незаконны. Бейсбольные модели по большей части не используют прокси из-за того, что они располагают фактической информацией: мячами, страйками и хитами.

Но самое главное – поток этой информации постоянно обновляется благодаря статистике, собираемой с 12–13 игр ежедневно с апреля по октябрь. Специалисты по статистике могут сравнить результаты этих игр с предсказаниями своих моделей – и увидеть, где они были не правы. Возможно, они предсказали, что реливер-левша пропустит много хитов от бэттеров-правшей – а он в результате их разгромил. В этом случае статистики пытаются подправить свою модель и пристально изучают, как и почему они ошиблись. Возможно, это новый крученый мяч питчера повлиял на их статистику? Или этот питчер лучше играет по вечерам? Все, что они узнают, они снова загрузят в модель, чтобы еще тоньше настроить ее. Именно так работают модели, заслуживающие доверия. Они постоянно взаимодействуют с миром, который они пытаются понять или предсказать. Если условия меняются – модель должна меняться вместе с ними.

Посмотрев сейчас на бейсбольную модель с ее тысячами переменных, вы можете задуматься: как вообще можно сравнивать ее с моделью, использованной для оценки учителей в школах Вашингтона? Первая моделирует спортивную игру в мельчайших деталях и постоянно обновляется. Вторая, при всей ее таинственности, опирается из года в год на результаты горстки тестов. Можно ли вообще называть ее моделью?

Ответ – да. Любая модель, в конце концов, есть не что иное, как абстрактное представление какого-то процесса, будь то бейсбольная игра, цепочка поставщиков нефтяной компании, действия иностранного правительства или посещаемость кинотеатра. Загружена ли она в компьютерную программу или хранится в нашей голове, модель берет наши знания и использует их для того, чтобы предсказать будущие результаты процесса в разных ситуациях. Все мы держим в уме тысячи моделей. Они подсказывают, чего нам ожидать, и руководят нашими действиями.

Вот неформальная модель, которую я использую ежедневно. Будучи мамой троих детей, я сама готовлю еду – мой муж, милейший человек, каждый раз забывает посолить макароны. Каждый вечер, когда я начинаю готовить ужин на всю семью, я внутренне и интуитивно моделирую аппетит каждого домочадца. Я знаю, что один из сыновей любит курицу (но ненавидит гамбургеры), а другой ест только пасту (с дополнительной порцией тертого пармезана). Но я также принимаю во внимание то, что их аппетиты меняются в разные дни – поэтому в мою модель может вкрасться ошибка. В ней всегда будет неизбежный элемент неопределенности.

В мою модель вкладывается информация о моей семье, об ингредиентах, которые у меня уже имеются или мне доступны, а также моей собственной энергии, времени и амбициях. На выходе я получаю решение, что и как мне приготовить. Я оцениваю успех ужина степенью удовлетворенности моей семьи, а также количеством съеденного и тем, насколько еда была здоровой. То, насколько хорошо принимают приготовленную мной еду и сколько ее съедают, позволяет мне обновить свою модель к следующему приготовлению ужина. Обновления и уточнения делают модель динамической – так это называется в статистике.

С гордостью могу сказать, что со временем я научилась очень неплохо готовить для своей семьи. Но представьте, что нам с мужем нужно уехать на неделю, а мне понадобится объяснить свою модель моей маме, чтобы она смогла меня заменить? Или если моя многодетная подруга заинтересовалась моим подходом? В этот момент я попытаюсь придать моей модели какие-то более формальные черты, сделать ее более систематической – и, в каком-то смысле, более математической. Если у меня хватит амбиций, я даже могу создать на ее основе компьютерную программу.


Рекомендуем почитать
Гражданственность и гражданское общество

В монографии на социологическом и культурно-историческом материале раскрывается сущность гражданского общества и гражданственности как культурно и исторически обусловленных форм самоорганизации, способных выступать в качестве социального ресурса управляемости в обществе и средства поддержания социального порядка. Рассчитана на научных работников, занимающихся проблемами социологии и политологии, служащих органов государственного управления и всех интересующихся проблемами самоорганизации и самоуправления в обществе.


Уклоны, загибы и задвиги в русском движении

Перед Вами – сборник статей, посвящённых Русскому национальному движению – научное исследование, проведённое учёным, писателем, публицистом, социологом и политологом Александром Никитичем СЕВАСТЬЯНОВЫМ, выдвинувшимся за последние пятнадцать лет на роль главного выразителя и пропагандиста Русской национальной идеи. Для широкого круга читателей. НАУЧНОЕ ИЗДАНИЕ Рекомендовано для факультативного изучения студентам всех гуманитарных вузов Российской Федерации и стран СНГ.


Классовая борьба. Государство и капитал

Книга дает марксистский ключ к пониманию политики и истории. В развитие классической «двуполярной» диалектики рассматривается новая методология: борьба трех отрицающих друг друга противоположностей. Новая классовая теория ясно обозначает треугольник: рабочие/коммунисты — буржуазия/либералы — чиновники/государство. Ставится вопрос о новой форме эксплуатации трудящихся: государством. Бюрократия разоблачается как самостоятельный эксплуататорский класс. Показана борьба между тремя классами общества за обладание политической, государственной властью.


Счастливый клевер человечества: Всеобщая история открытий, технологий, конкуренции и богатства

Почему одни страны развиваются быстрее и успешнее, чем другие? Есть ли универсальная формула успеха, и если да, какие в ней переменные? Отвечая на эти вопросы, автор рассматривает историю человечества, начиная с отделения человека от животного стада и первых цивилизаций до наших дней, и выделяет из нее важные факты и закономерности.Четыре элемента отличали во все времена успешные общества от неуспешных: знания, их интеграция в общество, организация труда и обращение денег. Модель счастливого клевера – так называет автор эти четыре фактора – поможет вам по-новому взглянуть на историю, современную мировую экономику, технологии и будущее, а также оценить шансы на успех разных народов и стран.


Нации и этничность в гуманитарных науках. Этнические, протонациональные и национальные нарративы. Формирование и репрезентация

Издание включает в себя материалы второй международной конференции «Этнические, протонациональные и национальные нарративы: формирование и репрезентация» (Санкт-Петербургский государственный университет, 24–26 февраля 2015 г.). Сборник посвящен многообразию нарративов и их инструментальным возможностям в различные периоды от Средних веков до Новейшего времени. Подобный широкий хронологический и географический охват обуславливается перспективой выявления универсальных сценариев конструирования и репрезентации нарративов.Для историков, политологов, социологов, филологов и культурологов, а также интересующихся проблемами этничности и национализма.


Геноцид белой расы. Кризис Европы. Как спастись, как преуспеть

100 лет назад Шпенглер предсказывал закат Европы к началу XXI века. Это и происходит сейчас. Европейцев становится все меньше, в Париже арабов больше, чем коренных парижан. В России картина тоже безрадостная: падение культуры, ухудшение здоровья и снижение интеллекта у молодежи, рост наркомании, алкоголизма, распад семьи.Кто виноват и в чем причины социальной катастрофы? С чего начинается заболевание общества и в чем его первопричина? Как нам выжить и сохранить свой генофонд? Как поддержать величие русского народа и прийти к великому будущему? Как добиться процветания и счастья?На эти и многие другие важнейшие вопросы даст ответы книга, которую вы держите в руках.