Веб-аналитика: анализ информации о посетителях веб-сайтов - [17]
• Если веб-сервер не устанавливает файлы cookie, идентификация посетителей с любой степенью точности крайне сомнительна.
• Веб-журналы создавались для фиксации всех обращений к серверу. Следовательно, при их использовании для получения точных тенденций трафика и поведения необходимо правильно отфильтровать запросы изображений, ошибки загрузки страниц, трафик роботов, запросы файлов каскадных таблиц стилей (Cascading Style Sheet — CSS) и т.д.
• Кеширование страниц провайдерами (ISP) и прокси-серверами может привести к тому, что некая часть трафика (порядка 10 процентов) окажется неучтенной, поскольку когда некто в сети ISP запрашивает ту же страницу, которую кто-то другой уже запрашивал до него, ISP передаст ее из своего кеша и не будет беспокоить веб-сервер. Следовательно, у владельца веб-сервера не появится в файле журнала запись об этом запросе.
К лучшему или нет, но в использование веб-журналов как источников данных для веб-анализа внесено не много новшеств. К веб-журналам следует обращаться для анализа поведения роботов поисковой системы, чтобы замерить успешность усилий по ее оптимизации. Для выполнения практически всех остальных типов веб-анализа, которые могут понадобиться, оптимальными будут другие механизмы сбора данных. Веб-журналы, в лучшем случае, можно использовать для дополнения данных, собранных с применением других методик, но будьте готовы к сложностям и большому количеству усилий.
Веб-маяки (Web beacon) разрабатывались в те времена, когда в веб царили баннеры в стиле “вырви глаз”, которые “липли” к веб-сайтам, обращения к которым следовало измерить. Компания распространяла баннеры по многим веб-сайтам, и зачастую их оказывалось по несколько на одной странице. Имелась насущная потребность выяснить не только количество людей, видевших баннер и щелкавших на нем, но также и то, сколько раз это был один и тот же человек. Или наоборот, если тому же человеку были предоставлены разные возможности (баннер, текст и т.д.), то что сработало эффективнее?
Веб-маяки — это обычно прозрачные изображения размером 1x1 пиксель, которые помещают на веб-страницу при помощи дескриптора HTML img src. Прозрачные изображения, как правило, находятся на сервере стороннего исполнителя, отличном от сервера, содержащего веб-страницу.
Рис. 2.2 демонстрирует, как веб-маяки фиксируют данные.
Процесс протекает следующим образом:
1. Клиент вводит URL в браузере.
2. Запрос страницы поступает на один из веб-серверов.
Рис. 2.2. Как веб-маяки фиксируют данные
3. Веб-сервер посылает страницу клиенту наряду с запросом прозрачного изображения размером 1 х 1 пиксель, которое находится на сервере стороннего исполнителя.
4. При загрузке страницы она запрашивает изображение размером 1 х 1 пиксель, оповещая таким образом стороннего исполнителя о просмотре страницы.
5. Сервер стороннего исполнителя посылает изображение браузеру пользователя наряду с кодом, способным читать файлы cookie и собирать анонимные данные о посетителе, включая сам факт просмотра страницы, IP-адрес, время просмотра, файлы cookie, которые были установлены ранее, и т.д.
Веб-маяки применимы также в электронной почте (например, информационные бюллетени или рекламные письма, которые мы все получаем). Здесь, как и на веб-странице, в ходе загрузки электронной почты в приложение ее чтения запрашивается прозрачное изображение, и данные о доставке письма отсылаются обратно и записываются. К типичным данным, собираемым таким образом, относится сам факт получения и чтения сообщения, соответственно, адрес электронной почты и любые другие параметры, которые могут быть добавлены в конец запроса прозрачного изображения, встроенного в сообщение электронной почты. С распространением дескрипторов JavaScript использование веб-маяков стало менее популярным; обычно они применяются для отслеживания баннеров и сообщений электронной почты.
• Веб-маяки легко реализуемы (в большинстве случаев), поскольку они представляют собой лишь пару строк кода в оболочке дескриптора HTML img src. Весь “интеллект”, ответственный за сбор возвращаемых данных, сосредоточен на том сервере, который получает запрос изображения.
• Существует возможность точно указать, какие данные собирает маяк (например, только о просмотре страниц или включая время, значения файлов cookie, или даже реферрер), а поскольку роботы запросов изображений не выполняют, сбор нежелательных данных исключен. Это позволит поддерживать размер журнала в контролируемых пределах и не потребует сложной фильтрации.
• Веб-маяки незаменимы при сборе данных для нескольких веб-сайтов или доменов (рис. 2.3). Когда одинаковое содержимое размещается на нескольких сайтах или когда компания имеет множество сайтов в собственной сети, для облегчения сбора и хранения данных обо всех этих сайтах на одном сервере можно использовать маяки (со всех сайтов запрашивается тот же маяк). Это позволяет узнать, что в целом происходит на разных веб-сайтах, а следовательно, лучше представить содержимое посетителям. Фиксируемые данные менее глубоки, чем у других методик, но для конкретных специфических целей (баннеры, электронная почта и т.д.) данная методика работает очень хорошо.