Искусство статистики. Как находить ответы в данных

Искусство статистики. Как находить ответы в данных

Статистика играла ключевую роль в научном познании мира на протяжении веков, а в эпоху больших данных базовое понимание этой дисциплины и статистическая грамотность становятся критически важными. Дэвид Шпигельхалтер приглашает вас в не обремененное техническими деталями увлекательное знакомство с теорией и практикой статистики. Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики. На русском языке публикуется впервые.

Жанры: Математика, Экономика, Базы данных
Серия: МИФ. Научпоп
Всего страниц: 99
ISBN: 9785001692508
Год издания: 2021
Формат: Фрагмент

Искусство статистики. Как находить ответы в данных читать онлайн бесплатно

Шрифт
Интервал

Издано с разрешения Penguin Books Ltd и Andrew Nurnberg Literary Agency


Все права защищены.

Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.


Original English language edition first published by Penguin Books Ltd, London

Text copyright © David Spiegelhalter 2019

The author has asserted his moral rights.

All rights reserved.

© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2021

Статистикам всего мира – педантичным, отзывчивым, добросовестным людям, стремящимся использовать данные наилучшим образом


Введение

Цифры сами по себе не умеют говорить. Именно мы говорим за них. Мы наполняем их смыслом.

Нейт Сильвер, «Сигнал и шум»[1],[2]
Зачем нужна статистика?

Психологический портрет Гарольда Шипмана, более известного как Доктор Смерть, не похож на серийного убийцу, тем не менее этот человек поставил рекорд по убийствам. Тихий семейный врач, работавший в пригороде Манчестера, в период с 1975 по 1998 год ввел как минимум 215 пожилым пациентам смертельную дозу опиатов. Но в конце концов он «прокололся», подделав завещание одной из своих жертв, которая якобы оставила ему часть наследства, что весьма насторожило ее дочь-адвоката. Проверка компьютера врача показала, что он задним числом изменял информацию в медицинских картах пациентов, чтобы состояние их здоровья казалось хуже, чем было на самом деле. Он считался увлеченным поборником технологий, но не был достаточно технически подкован, чтобы понимать, что время каждого внесенного изменения фиксируется (кстати, хороший пример метаданных, раскрывающих скрытый смысл данных).

В результате эксгумации пятнадцати тел его пациентов (из тех, которых не кремировали) в них были обнаружены смертельные дозы диаморфина, медицинской формы героина. В 1999 году Шипмана судили за пятнадцать убийств и приговорили к пожизненному заключению. Он не защищался и не произнес на суде ни слова. Впоследствии было инициировано публичное расследование, чтобы определить, какие еще преступления он мог совершить, помимо рассмотренных в суде, и можно ли было разоблачить его раньше. Я был одним из нескольких статистиков, которых тогда привлекали к расследованию. Оно пришло к выводу, что он определенно убил 215 пациентов, а, возможно, и еще 45[3].

Эта книга посвящена применению статистики[4] для поиска ответов на вопросы (некоторые из них выделены), которые возникают, когда мы пытаемся лучше понять мир. Чтобы получить представление о мотивах поведения Шипмана, вполне закономерно спросить:

Каких людей убивал Гарольд Шипман, и когда они умирали?

В ходе упомянутого расследования была представлена информация о возрасте, поле и дате смерти каждой жертвы. Рис. 0.1 – довольно сложная визуализация этих данных, отображающая возраст и дату смерти жертвы, при этом цвет точек указывает на пол – мужской или женский. На осях добавлены гистограммы, демонстрирующие распределение по возрасту (с интервалом в пять лет).


Рис. 0.1

Диаграмма рассеяния, показывающая возраст и год смерти 215 подтвержденных жертв Гарольда Шипмана. По осям добавлены гистограммы, демонстрирующие распределение по возрасту и году совершения убийства


Даже беглый взгляд на рисунок позволяет сделать некоторые выводы. Черных точек больше, чем белых, а значит, жертвами Шипмана в основном были женщины. Гистограмма справа демонстрирует, что возраст большинства жертв – 70–80 лет, но разброс точек показывает, что, хотя изначально все жертвы были пожилыми, впоследствии появилось несколько более молодых пациентов. Гистограмма сверху четко показывает промежуток примерно в 1992 году, когда убийств не происходило. Оказывается, до этого Шипман имел общую практику с другими врачами, но затем – возможно, чтобы избежать подозрений, – стал работать один. После чего его деятельность активизировалась, что и отображено на верхней гистограмме.

Анализ случаев, выявленных в ходе расследования, приводит к дальнейшим вопросам о том, как Шипман совершал убийства. Определенная статистическая информация содержится в данных о времени смерти жертв (указывалось в свидетельстве о смерти). На рис. 0.2 сравниваются два линейных графика: время смерти пациентов Шипмана и пациентов других местных семейных врачей. Здесь не нужен тонкий анализ: разница видна невооруженным глазом. Пациенты Шипмана в подавляющем большинстве умирали вскоре после полудня.


Рис. 0.2

Сравнение времени смерти пациентов Шипмана и пациентов других семейных врачей. Выявление закономерности не требует углубленного статистического анализа


Хотя сами по себе эти данные не объясняют причин такой особенности, дальнейшее расследование обнаружило, что он посещал пожилых больных на дому после обеда, когда, как правило, оставался с ними наедине. Он предлагал им инъекцию якобы для улучшения самочувствия, которая на самом деле была смертельной дозой диаморфина. После того как пациент на его глазах тихо отходил в мир иной, Шипман вносил изменения в медицинскую карту, чтобы смерть выглядела естественной.

Судья Джанет Смит, возглавлявшая публичное расследование, позже говорила: «Я все еще чувствую, насколько это страшно, просто невообразимо и немыслимо. Этот человек изо дня в день ходил к людям, притворяясь на редкость заботливым врачом, неся с собой смертельное оружие, которое он неоднократно хладнокровно использовал».


Рекомендуем почитать
Неземной талисман (Сборник)

В книгу вошли повести и рассказы - фантастика и реалистическая проза.Повести: «Неземной талисман», «Последний шаг профессора Вудда».Рассказы: «Горы хранят тайну», «ЧП в воздухе», «Старая карта», «Кнопка», «Горючий Иван».


Сначала нарушьте все правила!

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


«Сокол-1»

В документальной повести автор, дважды Герой Советского Союза генерал-полковник авиации Владимир Дмитриевич Лавриненков, тепло и с глубоким знанием дела рассказывает о своем замечательном командире Герое Советского Союза Льве Львовиче Шестакове, человеке беспримерной храбрости, новаторе воздушного боя, строгом и взыскательном воспитателе, заботливом наставнике крылатых воинов, вставших на защиту любимой Родины.Книга рассчитана на широкий круг читателей и прежде всего на молодежь.


Снежный ангел

Печальная и радостная, как само Рождество, история о людях, которые всю жизнь искали друг друга, бродили в потемках и рождественским вечером все-таки нашли. Но прежде им пришлось пройти через испытания, и боль, и разлуку, и непонимание. И только тогда они поняли, что главное – это любить друг друга. Просто любить.Память Рэйчел сохранила лишь одно-единственное светлое воспоминание о детстве: они с отцом ночью, после волшебного снегопада, творят на искрящемся снегу ангелов. Рэйчел падает в снег, машет руками, отец подхватывает ее на руки, а в снегу остается ангел.


Стратегии решения математических задач

Любую задачу можно решить разными способами, однако в учебниках чаще всего предлагают только один вариант решения. Настоящее умение заключается не в том, чтобы из раза в раз использовать стандартный метод, а в том, чтобы находить наиболее подходящий, пусть даже и необычный, способ решения.В этой книге рассказывается о десяти различных стратегиях решения задач. Каждая глава начинается с описания конкретной стратегии и того, как ее можно использовать в бытовых ситуациях, а затем приводятся примеры применения такой стратегии в математике.


Урожаи и посевы

Первый перевод с французского книги «Recoltes et Semailles» выдающегося математика современности Александра Гротендика. Автор пытается проанализировать природу математического открытия, отношения учителя и учеников, роль математики в жизни и обществе. Текст книги является философски глубоким и нетривиальным и носит характер воспоминаний и размышлений. Книга будет интересна широкому кругу читателей — математикам, физикам, философам и всем интересующимся историческими, методическими и нравственными вопросами, связанными с процессом математического открытия и возникновения новых теорий.


Самые знаменитые головоломки мира

Сборник математических задач и увлекательных головоломок, принадлежащий перу одного из классиков этого жанра Сэма Лойда, несомненно доставит большое удовольствие всем любителям занимательной математики.


Алиса в Стране Смекалки

Рэймонд Смаллиан счастливо сочетает в одном лице философа, логика, математика, музыканта, фокусника, юмориста, писателя и составителя великолепных задач-головоломок. Искусный писатель и великолепный юморист, Смаллиан любит облекать свои задачи в литературную форму, нередко пародирующую какие-нибудь известные произведения. Делает он это настолько хорошо, что его книги, изобилующие всякого рода парадоксами, курьезами и задачами, с удовольствием читают и те, кто даже не пытается решать задачи.В книге, которую вы держите сейчас в руках, кэрролловская Алиса из Страны Чудес и ее друзья раскрывают перед читателем нескончаемую вереницу задач-головоломок.


Математика. Утрата определенности.

Книга известного американского математика, профессора Нью-Йоркского университета М. Клайна, в яркой и увлекательной форме рисующая широкую картину развития и становления математики от античных времен до наших дней. Рассказывает о сущности математической науки и ее месте в современном мире.Рассчитана на достаточно широкий круг читателей с общенаучными интересами.


Геометрия: Планиметрия в тезисах и решениях. 9 класс

В пособии конспективно изложен школьный курс геометрии. Приведены комплекты экзаменационных билетов, задачи и их решения, распределённые по различным уровням сложности.Материалы пособия соответствуют учебной программе школьного курса геометрии.Для учителей и учащихся 9-х классов.


Семь с половиной уроков о мозге

Лиза Фельдман Барретт, известная ученая, занимающаяся исследованиями мозга, развенчивает мифы, настолько плотно укоренившиеся в нашем сознании, что многие годы они кажутся нам неопровержимыми научными фактами. Небольшие, интересные и понятные эссе (плюс одна короткая история об эволюции мозга) откроют вам дверь в удивительный мир человеческого разума. Вы узнаете, как начал формироваться мозг, какова его структура (и почему это важно понимать), как ваш мозг взаимодействует с мозгом других людей и создает всю ту реальность, в которой вы живете.


Десять уравнений, которые правят миром. И как их можете использовать вы

Если вы сомневались, что вам может пригодиться математика, эта книга развеет ваши сомнения. Красота приведенных здесь 10 уравнений в том, что пронизывают все сферы жизни, будь то грамотные ставки, фильтрование значимой информации, точность прогнозов, степень влияния или эффективность рекламы. Если научиться вычленять из происходящего данные и математические модели, то вы начнете видеть взаимосвязи, словно на рентгене. Более того, вы сможете управлять процессами, которые другим кажутся хаотичными. В этом и есть смысл прикладной математики. На русском языке публикуется впервые.


Бесконечная сила

Популяризатор науки мирового уровня Стивен Строгац предлагает обзор основных понятий матанализа и подробно рассказывает о том, как они используются в современной жизни. Автор отказывается от формул, заменяя их простыми графиками и иллюстрациями. Эта книга – не сухое, скучное чтение, которое пугает сложными теоретическими рассуждениями и формулами. В ней много примеров из реальной жизни, которые показывают, почему нам всем нужна математика. Отличная альтернатива стандартным учебникам. Книга будет полезна всем, кто интересуется историей науки и математики, а также тем, кто хочет понять, для чего им нужна (и нужна ли) математика. На русском языке публикуется впервые.


Парадокс упражнений

Если упражнения полезны, почему большинство их избегает? Если мы рождены бегать и ходить, почему мы стараемся как можно меньше двигаться? Действительно ли сидячий образ жизни — это новое курение? Убивает ли бег колени и что полезнее — кардио- или силовые тренировки? Дэниел Либерман, профессор эволюционной биологии из Гарварда и один из самых известных исследователей эволюции физической активности человека, рассказывает, как мы эволюционировали, бегая, гуляя, копая и делая другие — нередко вынужденные — «упражнения», а не занимаясь настоящими тренировками ради здоровья. Это увлекательная книга, после прочтения которой вы не только по-другому посмотрите на упражнения (а также на сон, бег, силовые тренировки, игры, драки, прогулки и даже танцы), но и поймете, что для борьбы с ожирением и диабетом недостаточно просто заниматься спортом.