Веб-аналитика: анализ информации о посетителях веб-сайтов - [165]

Шрифт
Интервал

В мире, изобилующем тоннами показателей, где каждая панель инструментов имеет по 15 графиков, контрольные границы чрезвычайно полезны при манипулировании мощью статистики в качестве первого фильтра, указывающего, когда вам нужно углубиться и искать причину. Если ваши показатели и тенденции варьируют изо дня в день и с недели на неделю — это прекрасный способ отделить то, что нормально, от того, что выходит за норму для тенденции.

Вычисление контрольных границ

Общее эмпирическое правило для вычисления контрольных границ гласит: среднее значение KPI ± (3 х среднеквадратичное отклонение).

Контрольные границы составляют три или меньше среднеквадратичных отклонения от среднего значения вашего KPI. Они не назначаются, а скорее вычисляются на основании естественного вывода ваших данных. Все, что внутри контрольных границ, должно рассматриваться как ожидаемая вариация (естественный биоритм). Все, что вне их (триггеры), гарантирует новые исследования. Ряд значений, выходящих за пределы контрольных границ — это большой красный флаг, свидетельствующий о том, что что-то пошло не так.

Любое приличное статистическое программное обеспечение автоматически вычислит контрольные границы и создаст эти графики. Minitab используется многими людьми (хотя он и не дешев). Для вычисления контрольных границ вы можете также применить свои стандартные инструменты бизнес-интеллекта, такие как Brio, Business Objects, Cognos и MicroStrategy.

Для вычисления контрольных границ вы можете также на скорую задействовать Microsoft Excel. Вы можете начинать с использования электронной таблицы, содержащейся на CD, сопровождающем эту книгу. Она была создана Клинтом Иви (Clint Ivy) (http://blog.instantcognition.com) и иллюстрирует момент использования одного среднеквадратичного отклонения, но вы можете легко модифицировать его так, чтобы использовать три среднеквадратичных отклонения.

Контрольные диаграммы хорошо масштабируются. Жизнь была бы очень проста, если бы для каждого показателя имелась четко установленная цель. Ориентируясь на эту цель, можно было бы сразу сказать, хорошо идут дела или плохо. В действительности для большинства показателей, с которыми вам предстоит иметь дело, цели имеются очень редко. Пределы достаточно универсальны, и вы можете применять контрольные границы ко всем тенденциям.

Практические соображения по использованию контрольных диаграмм (пределов)

Как всегда в статистике, чем больше точек данных вы имеете, тем лучше будут ваши контрольные границы. Было бы трудно создать контрольную диаграмму, которая имела бы смысл только по пяти точкам (мы можете создать ее, но она не будет иметь смысла).

Контрольные границы лучше всего работают с теми показателями или KPI, для которых просто контролировать релевантные переменные.

Например, создавать контрольные границы для общего показателя переходов было бы менее полезно, если вы осуществляете кампании прямого маркетинга, по электронной почте, маркетинга в поисковых системах (платы за щелчок) или партнерский маркетинг и имеете массу людей, приходящих непосредственно на ваш сайт. Здесь будет слишком много переменных, способных воздействовать на вашу тенденцию.

Но вы можете легко создать контрольные диаграммы для своих кампаний электронной почты, PPC или прямого трафика. Это было бы весьма полезно, поскольку вы имеете только одну переменную (или две) и сможете без проблем обнаружить точки-триггеры и, в свою очередь проанализировав их, выработать действия.

Чтобы оптимально манипулировать статистикой и иметь возможности объяснить ее мощь своему руководству, вы должны хорошо изучить ее и получить некоторые базовые знания о среднеквадратичных отклонениях.

Практический пример использования контрольных границ

Рис. 14.13 демонстрирует показатель переходов веб-сайта для кампаний прямого маркетинга.

На нем без красной (UCL) и синей (LCL) линий было бы трудно отследить эффективность кампаний прямого маркетинга из месяца в месяц. Вполне очевидно, что в январе 2005 года эффективность была ужасна. Намного сложнее понять, что с марта по июль статистически ничего существенного не происходило несмотря на то, что тенденция шла и вверх и вниз.

Последний момент очень важен. При серьезном провале любому понятно, что нужно принимать срочные меры. Но небольшие колебания в данных, биоритмы, скрывающие истинные триггеры, требующие отделения сигнала от шума, ставят большинство аналитиков в тупик.


Рис. 14.13. Тенденция показателя переходов прямого маркетинга с контрольными границами


Дополнительные советы: справьтесь с выбросами (если хотите избавиться от зарубок)

Вы можете также применить статистическую методику под названием винсоризация (Winsorization), которая использует проценты вместо среднеквадратичных отклонений, а следовательно, более устойчива к выбросам (экстремальные точки). Основная суть в том, что вы отвергаете 5 или 10% данных сверху и снизу. Затем осуществляете свои обычные статистические вычисления на основании оставшихся данных (среднее, STD и т.д.). Для наборов данных с большими флуктуациями это простой, но практичный способ “подавить” шум и сосредоточиться на сигнале. Более подробная информация по данной теме приведена по адресу