Голая статистика. Самая интересная книга о самой скучной науке - [31]

Шрифт
Интервал

Если построить диаграмму разброса данных, отражающих рост и вес произвольной выборки взрослых американцев, то получится примерно такая картина:



Если бы нам нужно было построить диаграмму разброса для данных о выполнении физических упражнений (количество минут, затрачиваемых на них каждую неделю) и данных о весе человека, то можно было бы ожидать отрицательной корреляции, причем те, кто занимается спортом больше времени, будут весить меньше. Однако картина в виде совокупности точек, разбросанных по определенной площади, представляет собой несколько неуклюжий инструмент. (Если бы Netflix попыталась предлагать мне какие-то фильмы, продемонстрировав диаграмму разброса рейтингов для тысяч кинолент, выставленных миллионами кинозрителей, то я посчитал бы такую рекомендацию просто неудачной шуткой.) Эффективность корреляции как статистического инструмента заключается в том, что мы можем выразить связь между двумя переменными с помощью одной описательной статистики – коэффициента корреляции.

Коэффициент корреляции обладает двумя чрезвычайно привлекательными характеристиками. Во-первых, в силу причин математического характера, которые мы обсудим в приложении, он представляет собой число в диапазоне от −1 до 1. Корреляция, равная 1 (иногда ее называют идеальной корреляцией), означает, что каждому изменению одной переменной соответствует эквивалентное изменение другой переменной в том же направлении.

Корреляция, равная –1 (иногда ее называют идеальной отрицательной корреляцией), означает, что каждому изменению одной переменной соответствует эквивалентное изменение другой переменной в противоположном направлении.

Чем ближе корреляция к 1 или –1, тем сильнее связь между переменными. Нулевая (или близкая к 0) корреляция говорит об отсутствии значимой связи между двумя переменными (например между результатом экзамена по математике и размером обуви экзаменуемого).

Второй привлекательной особенностью коэффициента корреляции является то, что с ним не связаны никакие единицы измерения. Мы можем рассчитать корреляцию между ростом и весом, несмотря на то что рост измеряется в дюймах, а вес – в фунтах. Мы можем даже вычислить корреляцию между количеством телевизоров, имеющихся дома у учеников, и результатами их экзаменов по математике (я почему-то уверен, что она окажется положительной). (Несколько ниже я остановлюсь подробнее на данной связи.) Коэффициент корреляции буквально творит чудеса: он сжимает сложное сочетание данных, измеряемых в разных единицах (наподобие наших диаграмм разброса роста и веса), в единственную элегантную описательную статистику.

Как это удается?

Как обычно, я привожу самую распространенную формулу для определения коэффициента корреляции в приложении, находящемся в конце этой главы. Это не та статистика, которую можно вычислить вручную. (После того как вы введете соответствующие данные, базовый программный пакет, например Microsoft Excel, рассчитает корреляцию между двумя соответствующими переменными.) Тем не менее на интуитивном уровне понять эту формулу несложно. Формула для вычисления коэффициента корреляции выполняет следующие операции:

1. Вычисляет среднее значение и стандатное (среднеквадратическое) отклонение для обеих переменных. Если вернуться к примеру с ростом и весом, то мы бы узнали средний рост людей в выборке, средний вес людей в той же выборке и стандартное отклонение для роста и веса.

2. Преобразует все данные таким образом, чтобы каждое наблюдение было представлено его расстоянием (в стандартных отклонениях) от среднего значения. Верьте мне, это совсем не сложно. Допустим, средний рост в выборке равняется 66 дюймам (при стандартном отклонении в 5 дюймов), а средний вес – 177 фунтов (при стандартном отклонении в 10 фунтов). Теперь предположим, что ваш рост – 72 дюйма, а вес – 168 фунтов. Мы можем также сказать, что ваш рост составляет 1,2 стандартного отклонения сверх среднего роста [(72 ‒ 66)/5) = 1,2] и 0,9 стандартного отклонения ниже среднего веса, или –0,9 применительно к нашей формуле [(168 ‒ 177)/10 = –0,9]. Да, это нетипично, когда рост человека выше среднего, а вес – ниже среднего, но поскольку вы уже заплатили неплохие деньги за эту книгу, то, как мне кажется, я должен в знак благодарности сделать вас высоким худощавым человеком. Обратите внимание: ваш рост и вес, выражавшиеся поначалу в дюймах и фунтах, теперь выражаются абстрактными числами 1,2 и – 0,9. Как видите, потребность в единицах измерения отпала.

3. Теперь я могу скрестить руки на груди и предоставить возможность компьютеру выполнить остальную работу. Формула вычисляет связь по всей выборке между ростом и весом, которые измеряются в стандартных единицах. Когда рост отдельных людей в выборке равняется, к примеру, 1,5 или 2 стандартного отклонения выше среднего значения, какими должны быть значения их веса, измеренные в стандартных отклонениях от среднего значения для веса? А когда рост членов выборки близок к среднему значению, какими будут значения их веса, измеренные в стандартных единицах?


Если расстояние от среднего значения для одной переменной в целом соответствует – по величине и направлению – расстоянию от среднего значения для другой переменной (например, для людей, рост которых существенно отличается в ту или другую сторону от среднего значения роста, значения их веса, как правило, существенно отличаются от среднего значения веса, причем в том же направлении, что и рост), то у нас есть основания говорить о сильной положительной корреляции.


Еще от автора Чарльз Уилан
Голые деньги

Это книга о деньгах — о том, как бумажки, лежащие в вашем кошельке, приобрели большую ценность, и как соглашение, обусловившее обмен этих, казалось бы, бесполезных бумажек на реальные товары, стало фундаментальной концепцией современной экономики.


Голая экономика. Разоблачение унылой науки

Книга ученого, преподавателя и журналиста Чарлза Уилэна посвящена тому, что окружает нас всегда и повсюду, — экономике. Но Уилэн старается говорить с читателем об этом трудном и «унылом» предмете на понятном языке — без туманных определений, сложных графиков и запутанных уравнений, «разоблачая» таким образом экономику, используя многочисленные примеры из нашей повседневной жизни, автор лишает основные экономические понятия их таинственности и дает ответы на многие вопросы.Книга будет полезна руководителям предприятий, менеджерам, преподавателям, студентам высших учебных заведений и всем интересующимся экономическими проблемами.


Рекомендуем почитать
Космические бароны

«Космические бароны» – это рассказ о группе предпринимателей-миллиардеров, которые воспользовались своим богатством для эпического восстановления американской космической программы. Илон Маск и Джефф Безос, Ричард Брэнсон и Пол Аллен возглавили смелый поход по строительству новой космической транспортной системы – частной пилотируемой космонавтики.


Разреши себе скучать

Автор этой книги доказывает, что скука необходима нашему мозгу. Она активирует особый режим – блуждание ума, во время которого мозг генерирует новые идеи и по-новому осмысливает мир. Подружиться со скукой нам мешают цифровые технологии, которые занимают все наше время. Книга предлагает простую пошаговую программу избавления от цифровой зависимости. Эта программа вернет скуку, а вместе с ней и креативность в вашу жизнь. На русском языке публикуется впервые.


Варгань, кропай, марай и пробуй

Нейробиолог Шрини Пиллэй, опираясь на последние исследования мозга, примеры из спорта и бизнеса и истории из своей психологической практики, бросает вызов традиционному подходу к продуктивности. Вместо внимания и сосредоточенности он предлагает специально «расфокусироваться», чтобы стимулировать креативность, развить память, увеличить продуктивность и двигаться к целям. На русском языке публикуется впервые.


PIXAR. Перезагрузка. Гениальная книга по антикризисному управлению

Сложно найти человека, который не смотрел мультики компании Pixar. Но как крошечная рекламная студия превратилась в гиганта киноиндустрии? Это история о сильных людях и волевых решениях, о выборе и об абсурдных спорах, позволивших истории случиться. Она о том, как грамотное управление и контроль над ситуацией могут противостоять любым рискам. Благодаря этой книге вы узнаете, что стало движущей силой Pixar и как ей удалось справиться с многочисленными трудностями.


Эффективные письменные деловые коммуникации

Умение хорошо писать – не врожденный дар, а навык, который можно развивать, подобно многим другим. Книга, которую вы держите в руках, поможет вам приобрести необходимую уверенность и снабдит инструментами, которые понадобятся для совершенствования этого навыка. Книга будет полезна для всех, кому приходится писать электронные письма, коммерческие предложения, отчеты, доклады и т. п. На русском языке публикуется впервые.


Вместо MBA. Полезные советы от легендарных менеджеров

Разработка гибкой стратегии, преодоление трудностей роста, создание вау-команды, лидерство, удержание лучших, саморазвитие, умение держать удар – все эти вопросы волнуют каждого менеджера и тем более собственника бизнеса. В этой книге собраны советы предпринимателям от легендарного экс-СЕО General Electric Джека Уэлча и главного редактора Harvard Business Review Сюзи Уэлч. Учиться на хорошем опыте несравнимо лучше, чем на собственных ошибках, поэтому книга наполнена множеством примеров удачных управленческих решений, с которых можно брать пример.На русском языке публикуется впервые.