Веб-аналитика: анализ информации о посетителях веб-сайтов - [20]

Шрифт
Интервал

Процесс сбора данных с использованием анализа пакетов представлен на рис. 2.5.


Рис. 2.5. Сбор данных с использованием анализа пакетов


Сбор данных осуществляется в пять этапов.

1. Клиент вводит URL в браузере.

2. Запрос направляется на веб-сервер, но прежде чем достигнуть его, он проходит через программный или аппаратный анализатор пакетов, который может фиксировать атрибуты запроса и другие данные о посетителе.

3. Анализатор пакетов пересылает запрос на веб-сервер.

4. Результат запроса возвращается клиенту, но сначала проходит через анализатор пакетов. Последний фиксирует информацию о возвращении страницы и хранит эти данные. В некоторых решениях на базе анализа пакетов используются также дескрипторы JavaScript, которые могут возвращать анализатору пакетов большее количество данных о посетителе.

5. Анализатор пакетов пересылает страницу браузеру посетителя.

Анализатор пакетов может быть программой, установленной на веб-сервере и выполняющейся “поверх” его уровня данных. Это может быть и физический компонент аппаратных средств, который подключен к центру данных и пропускает весь трафик веб-сервера через решение анализатора пакетов.

Преимущества использования анализаторов пакетов в качестве механизма сбора данных

• Поскольку все данные проходят через анализатор пакетов, это, в первую очередь, устраняет необходимость в использовании на веб-сайте дескрипторов JavaScript, а в теории даже касаться веб-сайта вообще.

• Время подготовки немного больше, чем при применении дескрипторов JavaScript, в связи с необходимостью одобрения группой информационных технологий,

Стр. 59

а также установкой дополнительного программного обеспечения и оборудования в центре данных, но существенно меньше, чем при использовании других методов.

• Возможность немедленно собрать огромное количество данных, гораздо большее, чем при помощи стандартных дескрипторов JavaScript. Например, можно выявить ошибки сервера, степень использования пропускной способности, любую техническую информацию, связанную со страницей, а также деловые данные. Об анализе пакетов зачастую говорят, что он позволяет собрать наиболее исчерпывающий объем данных из когда-либо возможных (все 0 и 1!).

• С учетом характера решений остается возможность использовать файлы cookie и другие элементы по назначению.

Недостатки использования анализаторов пакетов в качестве механизма сбора данных

• Для большинства компаний самая актуальная проблема — убедить отдел информационных технологий в необходимости инсталлировать дополнительный слой программного обеспечения на веб-серверах или устанавливать дополнительные аппаратные средства на их высококлассные центры данных и перенаправлять весь веб-трафик через эти решения. Некоторые группы информационных технологий имеют естественный психологический барьер против всего того, что они считают нестандартным. Анализаторы пакетов — это дополнительный слой между клиентом и веб-страницей, т.е. нечто потенциально способное создавать проблемы.

• Не забывайте, происходит сбор необработанных пакетов трафика веб-сервера Интернета. В результате возникает две важные проблемы: отнюдь не тривиальные объемы работ по конфигурации решения анализатора пакетов, чтобы он исследовал только необходимые данные из всех доступных, и вторая проблема — безопасность. Необработанные пакеты позволяют фиксировать все данные, включая такие как пароли, имена, адреса и номера кредитных карточек. В результате необходима очень осторожная стресс-проверка и корректность опросов. Но, с другой стороны, применение дескрипторов JavaScript для дополнения анализаторов пакетов привело бы к проблемам, описанным ранее.

• При использовании большинства решений анализа пакетов для правильного сбора всех данных, необходимых при оптимальном анализе, все равно понадобятся дескрипторы JavaScript. Например, без них анализатор пакетов не получил бы никаких данных о кэшируемых страницах (поскольку в этом случае на веб-сервер никаких запросов не поступает). Добавим сюда и невозможность получения данных от файлов Adobe Flash, Ajax и улучшенных приложений Интернета (Rich Internet Application — RIA): эти глубоко автономные файлы поступают на браузер посетителя, и большая часть взаимодействия с ним происходит там, а следовательно, не отмечается традиционным анализатором пакетов (поскольку ресурс улучшенного взаимодействия не передает никаких запросов на сервер), а еще неспособность собрать информацию о базовой структуре и метаданных страниц при помощи исключительно внедрения анализатора пакетов.

• При наличии множества веб-серверов или веб-серверов в нескольких сетях (что нередкость) анализ пакетов может оказаться довольно дорогим. В этих случаях приходится устанавливать программное обеспечение или аппаратные средства во всех сетях.

Рекомендация

Методики на базе анализа пакетов весьма специфичны и в настоящее время поддерживаются лишь несколькими исполнителями веб-анализа. Для оптимальности и эффективности решение на базе анализа пакетов следует объединить с применением дескрипторов JavaScript. Как правило, анализаторы пакетов рекомендуется использовать совместно с дескрипторами JavaScript (или веб-журналами), восполняющими недостаток информации, необходимой организации. Подобно любой другой методике перед выбором данных стоит обсудить с исполнителем ее применимость в конкретном случае.