Голая статистика. Самая интересная книга о самой скучной науке - [65]

Шрифт
Интервал

Все наши рассуждения основываются на простейшей логике. Центральная предельная теорема позволяет пойти еще дальше, описывая ожидаемое распределение средних значений разных выборок, группирующихся вблизи среднего значения генеральной совокупности. А именно, средние значения этих выборок вблизи среднего значения нашей совокупности (в данном случае 70 900 долларов) распределены по нормальному закону. Вспомните, что форма распределения исходной совокупности значения не имеет. Распределение семейного дохода в Соединенных Штатах характеризуется значительным скосом, однако у распределения средних значений выборок скос отсутствует. Если бы мы взяли 100 разных выборок, каждая из которых включает 1000 семей, и построили график частоты наших результатов, то можно было бы ожидать, что средние значения этих выборок образуют хорошо знакомое нам «колоколообразное» распределение в районе 70 900 долларов.

Чем больше количество выборок, тем точнее это распределение аппроксимируется нормальным распределением. А чем больше размер каждой выборки, тем такое распределение будет уже. Чтобы проверить этот результат, давайте проведем эксперимент с реальными данными о весе реальных американцев. Мичиганский университет выполнил повторное исследование под названием Americans’ Changing Lives («Меняющаяся жизнь американцев»), которое предусматривает детальные наблюдения за несколькими тысячами взрослых американцев, в том числе и за их весом. Распределение веса слегка скошено вправо, поскольку биологически легче весить на 100 фунтов больше нормы, чем на 100 фунтов меньше нормы. Средний вес для всех взрослых в этом исследовании составляет 162 фунта.

С помощью компьютера и базового статистического программного обеспечения можно создать на основе данных Americans’ Changing Lives произвольную выборку из 100 человек. Вообще говоря, это можно делать многократно, чтобы увидеть, как полученные результаты согласуются с тем, что предсказывает нам центральная предельная теорема. Ниже приведен график распределения 100 средних значений выборок (с округлением до ближайшего фунта), сгенерированных случайным образом на основе данных Americans’ Changing Lives.



Чем больше размер выборки и чем больше выборок, тем точнее распределение их средних значений аппроксимируется нормальным распределением. (Чтобы обеспечить применимость центральной предельной теоремы, желательно, чтобы размер выборки был не менее 30.) Это должно быть понятно на интуитивном уровне. Большой размер выборки в меньшей степени подвержен случайным отклонениям. Выборка же из 2 человек может быть сильно скошена, если в ней окажется человек с необычайно большим (или слишком малым) весом. Напротив, на выборку из 500 человек лишь очень незначительно повлияет наличие в ней нескольких человек с нестандартным весом.

Итак, мы очень близки к тому, чтобы воплотить в жизнь все свои статистические мечты! Средние значения выборок распределены приблизительно по нормальному закону, как описано выше. Эффективность нормального распределения является следствием нашей информированности о том, какая примерно доля наблюдений окажется выше или ниже среднего значения на расстоянии, не превышающем одного среднеквадратического отклонения (68 %); на расстоянии, не превышающем двух среднеквадратических отклонений (95 %), и т. д. Это очень важная для нас информация.

Ранее в этой главе я указывал на возможность интуитивного вывода о том, что автобус с пассажирами, средний вес которых на двадцать пять фунтов превышает средний вес всех зарегистрированных участников марафона, вряд ли может быть потерявшимся автобусом с его участниками. Чтобы получить численное подтверждение своей интуитивной догадки – то есть иметь основания утверждать, что этот вывод окажется правильным в 95 (или в 99, или в 99,9) процентах случаев, – нам необходима еще одна техническая характеристика – стандартная (среднеквадратическая) ошибка.

Стандартная ошибка измеряет разброс средних значений выборок. Насколько предположительно близко они будут группироваться вокруг среднего значения совокупности? Здесь возможна некоторая путаница, поскольку вам уже известны два разных показателя разброса: среднеквадратическое (стандартное) отклонение и стандартная (среднеквадратическая) ошибка. Чтобы внести ясность в этот вопрос, нужно учитывать следующее.

1. Среднеквадратическое отклонение измеряет разброс в исходной совокупности. В данном случае оно может измерять разброс значения веса всех участников Framingham Heart Study, то есть разброс вблизи среднего значения для всех зарегистрированных участников марафона.

2. Стандартная ошибка измеряет разброс средних значений выборок. Если мы извлекли ряд выборок (в каждой по 100 значений) из Framingham Heart Study, то как будет выглядеть разброс их средних значений?

3. Вот что связывает между собой эти две концепции: стандартная ошибка является среднеквадратическим отклонением средних значений выборок! Замечательно, не правда ли?


Большая стандартная ошибка означает, что средние значения выборок разбросаны на значительных расстояниях от среднего значения совокупности; малая стандартная ошибка означает, что средние значения выборок располагаются относительно близко вокруг среднего значения совокупности. Ниже приведены три реальных примера на основе данных Americans’ Changing Lives.


Еще от автора Чарльз Уилан
Голые деньги

Это книга о деньгах — о том, как бумажки, лежащие в вашем кошельке, приобрели большую ценность, и как соглашение, обусловившее обмен этих, казалось бы, бесполезных бумажек на реальные товары, стало фундаментальной концепцией современной экономики.


Голая экономика. Разоблачение унылой науки

Книга ученого, преподавателя и журналиста Чарлза Уилэна посвящена тому, что окружает нас всегда и повсюду, — экономике. Но Уилэн старается говорить с читателем об этом трудном и «унылом» предмете на понятном языке — без туманных определений, сложных графиков и запутанных уравнений, «разоблачая» таким образом экономику, используя многочисленные примеры из нашей повседневной жизни, автор лишает основные экономические понятия их таинственности и дает ответы на многие вопросы.Книга будет полезна руководителям предприятий, менеджерам, преподавателям, студентам высших учебных заведений и всем интересующимся экономическими проблемами.


Рекомендуем почитать
Убедили! Как заявить о своей компетентности и расположить к себе окружающих

Блестящий придворный и знаток людей Ларошфуко говорил в свое время: «Свет чаще награждает видимость достоинств, нежели сами достоинства». Но как же действовать подлинно талантливому человеку, которого не замечают на фоне более уверенных соперников? Джек Нэшер, профессор менеджмента и всемирно известный эксперт в области деловых коммуникаций, призывает освоить стратегии общения, свойственные профессионалу, который впечатляет своей компетентностью и привык греться в лучах славы. Читателю предлагается «пересоздать» себя: усовершенствовать внешний облик, подобрать уместный гардероб, грамотно организовать рабочее пространство, заучить поведение, характерное для лидеров, и бесстрашно выступать с самопрезентацией перед коллегами и партнерами.


От батутов до попкорна – 2. 100 дел ФАС России против малого и среднего бизнеса

Эта книга – продолжение первой части, вышедшей в 2015 г. Во второй части анализируются 100 дел ФАС России против малого и среднего бизнеса за 2016—2018 гг. Несмотря на принятие 3.07.2016 закона об «иммунитетах» для малого бизнеса от антимонопольного контроля, подходы ФАС изменились незначительно. По основным объектом преследования остаются н самые крупные игроки на рынке. В книге предлагается реформа антимонопольного регулирования, предусматривающая полное прекращение преследования МСП.


Варгань, кропай, марай и пробуй

Нейробиолог Шрини Пиллэй, опираясь на последние исследования мозга, примеры из спорта и бизнеса и истории из своей психологической практики, бросает вызов традиционному подходу к продуктивности. Вместо внимания и сосредоточенности он предлагает специально «расфокусироваться», чтобы стимулировать креативность, развить память, увеличить продуктивность и двигаться к целям. На русском языке публикуется впервые.


Автоматический покупатель

Сразу после выхода в свет эта книга заняла первые места на Amazon среди книг по маркетингу и клиентскому сервису. Формирование источника регулярной выручки для компании – важная задача каждого предпринимателя. Благодаря разнообразию разновидностей бизнес-моделей на основе подписки для каждой отрасли можно найти подходящий вариант. Подписчики в любом случае намного ценнее для компании, чем обычные покупатели. Эта книга для всех, кто хочет построить бизнес-модель, приносящую регулярную прибыль. На русском языке публикуется впервые.


Отношение определяет результат

В бизнесе да и в жизни уже не так важно, что именно вы делаете. Гораздо важнее то, как вы это делаете. Дов Сайдман, основатель и CEO компании LRN, на страницах своей книги убедительно доказывает: моральные «факторы», прежде считавшиеся «факультативными», определяют сегодня ваш успех. Только ориентируясь на нравственные ценности, выстраивая отношения на основании доверия и заботясь о собственной репутации, вы сможете обойти конкурентов и преуспеть в бизнесе и в жизни. Эта книга будет полезна владельцам компаний, руководителям и менеджерам, которые заботятся не только о прибыли, но и о том, какое наследство они оставят своим детям.


Монетизация инноваций. Как успешные компании создают продукт вокруг цены

Инновации являются важнейшим фактором роста. Сегодня, более чем когда-либо, компании должны внедрять инновации, чтобы выжить. Но успешные инновации – это очень непростая задача. Авторы – партнеры всемирно известной консалтинговой компании Simon-Kucher & Partners Strategy & Marketing Consultants знают о чем говорят. Георг Таке – ее генеральный директор, а Мадхаван Рамануджам – партнер в Сан-Франциско. Simon-Kucher & Partners – глобальная консалтинговая компания, насчитывающая 900 профессионалов в 33 офисах по всему миру.