Голая статистика. Самая интересная книга о самой скучной науке - [54]

Шрифт
Интервал

. Данные заслуживают уважительного отношения – как и линия блокирующих игроков в американском футболе.

Как правило, данные выполняют одну из трех функций. Во-первых, нам может потребоваться определенная выборка данных, соответствующая характеристикам генеральной совокупности (так называемая репрезентативная выборка). Если наша задача – оценить отношение избирателей к конкретному политическому деятелю, нам понадобится опросить некоторую их часть (выборку) в соответствующем избирательном округе или в целом в стране. (Обратите внимание: нас не интересует выборка, которая представляла бы каждого, кто проживает на искомой территории; нам требуется выборка лиц, планирующих участвовать в голосовании.) Одно из самых фундаментальных положений статистики, более глубокому разъяснению которого мы уделим место в двух следующих главах, заключается в том, что выводы, сделанные на основе достаточно больших, надлежащим образом сформированных выборок, могут оказаться такими же точными, как и в случае, если бы мы попытались получить ту же информацию от всего населения.

Самый легкий способ собрать репрезентативную выборку большой генеральной совокупности – выбрать ее некоторое подмножество случайным образом. (Вы, наверное, испытаете потрясение, когда узнаете, что это называется простой случайной выборкой.) Ключом к данной методологии является то, что каждое наблюдение в соответствующей совокупности должно иметь одинаковые шансы на включение в выборку. Если вы собираетесь опросить случайную выборку, состоящую из 100 взрослых, на территории, где проживает 4328 взрослых, то ваша методология должна гарантировать, что у каждого из этих 4328 человек одинаковые шансы оказаться в числе той сотни, которую вы намерены опросить. Книги по статистике почти всегда иллюстрируют это положение вытаскиванием разноцветных шариков из урны. (В действительности это практически единственное место, где слово «урна» используется более или менее регулярно.) Если в какой-нибудь гигантской урне находится 60 000 голубых и 40 000 красных шариков, то наиболее вероятным составом выборки из 100 шариков, случайным образом вынутых из урны, было бы 60 голубых и 40 красных шариков. Если бы мы проделали такой эксперимент несколько раз, то, разумеется, всякий раз наблюдались бы какие-то отклонения (например, в одной выборке оказалось бы 62 голубых и 38 красных шариков, а в другой – 58 голубых и 42 красных шарика). Однако вероятность вытащить какую-либо произвольную выборку, которая по своему составу существенно отличалась бы от общего соотношения голубых и красных шариков, крайне мала.

Правда, на практике возникают кое-какие проблемы. Большинство совокупностей, которые могут представлять для нас интерес в реальной жизни, как правило, гораздо сложнее, чем урна с разноцветными шариками. Как, например, получить случайную выборку взрослого населения Америки, которую можно было бы использовать для проведения телефонного опроса? Даже такое элегантное на первый взгляд решение, как устройство для произвольного набора телефонных номеров, не лишено определенных недостатков. У некоторых людей (например, у малоимущих) может не быть телефона. Другие (обычно люди с высоким уровнем дохода) зачастую бывают не очень-то склонны отвечать на телефонные звонки, не представляющие для них непосредственного интереса. В главе 10 я опишу ряд стратегий, используемых компаниями, проводящими опросы, для решения проблем подобного рода, возникающих при формировании выборки (с появлением мобильной связи эти проблемы еще больше усложнились). Ключевая идея заключается в том, что надлежащим образом сформированная выборка будет полностью отражать структуру той совокупности, из которой она извлечена. Интуитивно вы можете представить себе это на примере варки супа в большой кастрюле. Если предварительно хорошенько размешать суп, то одна его ложка позволит вам составить достаточно полное представление о его вкусовых качествах.

В любом учебнике по статистике вы встретите значительно больше подробностей относительно методов формирования выборки. Компании, проводящие опросы и выполняющие маркетинговые исследования, тратят немало времени на поиск наиболее эффективных с экономической точки зрения способов получения надежных репрезентативных данных из разных совокупностей. На данном этапе вам необходимо уяснить несколько принципиальных положений. 1) Репрезентативная выборка – чрезвычайно важная вещь, поскольку она позволяет вам воспользоваться рядом наиболее мощных инструментов, которые имеются в распоряжении статистики. 2) Получить хорошую выборку гораздо сложнее, чем может показаться на первый взгляд. 3) Многие из самых ошибочных статистических утверждений обусловлены применением совершенно правильных статистических методов к плохим выборкам, а вовсе не наоборот. 4) Размер выборки имеет значение – чем она больше, тем лучше. Подробнее об этом мы поговорим в следующих главах, но уже сейчас вам должно быть интуитивно понятно, что крупная выборка дает возможность нивелировать любые аномальные отклонения. (Кастрюля супа, несомненно, более точно отражает его истинный вкус, чем ложка супа.) Важное предостережение: наращивание размера выборки не позволяет компенсировать ошибки, допущенные при выборе ее структуры (так называемую систематическую ошибку). Единственный способ устранения ошибок, порождаемых плохой выборкой, – использование хорошей выборки. Никакой суперкомпьютер или мудреная формула не помогут вам обеспечить правильность результатов


Еще от автора Чарльз Уилан
Голые деньги

Это книга о деньгах — о том, как бумажки, лежащие в вашем кошельке, приобрели большую ценность, и как соглашение, обусловившее обмен этих, казалось бы, бесполезных бумажек на реальные товары, стало фундаментальной концепцией современной экономики.


Голая экономика. Разоблачение унылой науки

Книга ученого, преподавателя и журналиста Чарлза Уилэна посвящена тому, что окружает нас всегда и повсюду, — экономике. Но Уилэн старается говорить с читателем об этом трудном и «унылом» предмете на понятном языке — без туманных определений, сложных графиков и запутанных уравнений, «разоблачая» таким образом экономику, используя многочисленные примеры из нашей повседневной жизни, автор лишает основные экономические понятия их таинственности и дает ответы на многие вопросы.Книга будет полезна руководителям предприятий, менеджерам, преподавателям, студентам высших учебных заведений и всем интересующимся экономическими проблемами.


Рекомендуем почитать
Как стать дизайнером, не продав душу дьяволу

Дизайнеры очень любят рассказывать о полете своей мысли и источниках вдохновения, но они гораздо менее открыты, когда речь заходит о таких важных вопросах, как найти заказы, как определить расценки и что делать, когда клиент отказывается от заказа, на который было потрачено несколько месяцев. Эта книга, выходящая уже во втором издании, призвана помочь решить проблемы молодых дизайнеров, которые хотят зарабатывать, создавая творчески интересные работы, при этом не превратившись в бездушных роботов, механически отрабатывающих очередной заказ.


Instagram для бизнеса: 40 хаков и готовых решений

Прочитав эту книгу, вы перестанете сомневаться в эффективности Instagram и научитесь грамотно использовать функционал этой соцсети. Мы приготовили более 40 практических хаков и вдохновляющих примеров, а также ценные рекомендации от экспертов Ingate и Another Point по самым важным вопросам: от создания аккаунта и выбора оптимальной стратегии до тонкостей продвижения и настройки рекламы.


Мир в 2050 году

Наш мир постоянно меняется, и в последние десятилетия – быстрее, чем когда бы то ни было. Стремительное развитие технологий, море информации, ее доступность – все это оказывает огромное влияние на состояние государств, рынков, гражданского общества.Каким станет мир к 2050 году? В книге – попытка экспертов легендарного The Economist ответить на этот вопрос. Но прогноз журналистов «Экономиста» – это не гадание на кофейной гуще. Они выявили и исследовали основные тенденции, оказывающие решающее воздействие на мир в различных сферах жизни – от здравоохранения до экономики, детально, доступным языком описали их и подкрепили большим количеством фактов, благодаря чему книга, несомненно, превратилась в ценный справочный инструмент.Она заинтересует каждого, кто стремится заглянуть вглубь событий, а также тех, кому небезразлично будущее нашей планеты.



Величайшая возможность в истории человечества

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Войны брендов

Как победить в войне — непримиримой войне брендов? Как сделать торговую марку непобедимой? Как избежать ошибок в процессе брендинга? Ведь эти ошибки допускают даже самые известные фирмы. Что нужно сделать, чтобы ваша фирма достигла успеха? На эти и множество других, связанных с ними, вопросов ответит книга, написанная одним из лучших в мире специалистов по маркегингу Дэвидом Д'Алессандро. Руководствуясь своим богатейшим опытом, автор предлагает несколько правил создания поистине непобедимого бренда.Издание будет интересно не только специалистам по маркетингу, бизнесменам, студентам и аспирантам, изучающим экономику, но самому широкому кругу читателей.