Веб-аналитика

индекс
30,43

Веб-аналитика: анализируй это! Часть 5. Разделяй и думай

Часть 1. Вступление.
Часть 2. Сбор данных.
Часть 3. Базовые метрики.
Часть 4. От статистики к аналитике

Продолжим наше путешествие в мир веб-аналитики. В прошлой части мы наконец вплотную занялись анализом статистики и получением информации из собираемых данных. Оказалось, что мы можем отследить поведение пользователя, но не причины этого поведения. А для того, чтобы стимулировать желательные поступки и предотвращать нежелательные, нужно знать именно причину этих поступков.

Каким же образом опытные аналитики “залезают в голову” пользователю, имея лишь усредненные данные по сайту? Никакой магии. Они проводят процедуры, которые разбирают эти авгиевы конюшни:

— Сегментируют данные: разделяют всех пользователей на группы исходя из определенных критериев и рассматривают поведение не всех пользователей, а каждой из этих групп в отдельности.

— Строят предположения и проверяют их: выискивают вероятные объяснения для сложившейся ситуации и пытаются повлиять на ситуацию исходя из этих предположений, наблюдая за результатом.

Сегментация данных


«Не сегментировать данные — это преступление против человечности»
Авинаш Кошик


Усреднение — это то, чего нужно бояться больше всего. Можно, конечно, суммировать статистику от пользователей, пришедших с рекламных объявлений, со статистикой от случайных посетителей; складывать посещения изо всех городов и стран; рассматривать «среднюю температуру по больнице, включая морг», как в популярном анекдоте. Однако, в таком случае полезных данных вы получите минимум, и выводы, которые вы из них сделаете, скорее всего, будут неправильными.

Перед началом работы забудьте, пожалуйста, всё, что вы знаете о своих пользователях. Вам предстоит анализировать беспристрастные данные статистики, и две вещи могут помешать вам: попытки использовать свои собственные суждения о пользователях и желание создать «усредненный портрет» для всей вашей аудитории. Все наоборот: чем больше разных портретов, разных групп вы увидите, тем больше вы узнаете о том, как угодить каждой из этих групп.

Сегментация возможна по любым параметрам, которые система веб-аналитики запоминает при показе страницы. Например:
— По региону
— По адресам сайтов, с которых пришел пользователь
— Для тех, кто увидел ваш сайт в поисковике — по запросу, который помог ему найти его
— Для тех, кто пришел с рекламного объявления — по объявлениям и рекламным площадкам
— По первой увиденной пользователем странице
— По техническим возможностям компьютера и интернет-соединения пользователя
— По тому, приходил ли пользователь на ваш сайт ранее
— По действиям пользователя на сайте.

Вот простой пример того, как работает сегментация.
Вы — владелец интернет-магазина, и вас, конечно же, волнует, каким образом можно увеличить его прибыльность. Вы заходите на Google Analytics и видите следующую картину:



Это усредненные данные по всем пользователям. Они могут представлять интерес только в динамике — их колебания являются сигналом о том, что ситуация поменялась и надо провести дополнительное расследование. Но настоящие откровения ждут нас дальше, в глубине, там, где данные сегментированы по всем возможным параметрам.

Зайдем, например, в раздел «Содержание». В нём удобно пользоваться пунктом «Содержание по заголовкам», так как в списке сразу же понятно (если на сайте корректные теги title), о какой странице идёт речь:



Мы только что сегментировали посещения по страницам, которые открывали пользователи. Здесь интересного уже больше. Мы можем увидеть:
— Какие страницы посещают чаще всего (Просмотры страниц)
— На каких чаще всего задерживаются (Средняя длительность просмотра страницы)
— Сколько процентов посетителей, начавших просмотр сайта с этой страницы, не перешли на другую, а сразу закрыли сайт (Показатель отказов)
— Сколько процентов посетителей закончили просмотр сайта на этой странице (% выходов).

Обратите внимание, что точность подсчета параметра зависит от количества собранных данных. Например, показав страницу 10 раз и получив 2 отказа, мы не можем с точностью утверждать, что показатель отказов составляет 20%: собрав больше статистики, мы сможем уточнить результат, и реальная цифра сможет отказаться как 10%, так и 30%. В качестве первого приближения можно считать, что колебания значения составляют плюс-минус корень из измеряемой величины. Так что, например, колебания посещаемости от 90 до 110 пользователей не говорят о системном изменении величины. Системные изменения иногда видны на глазок, но на это не стоит полагаться; для точных измерений, поскольку обычные системы статистики не позволяют строить линии тренда, можно либо загрузить статистику в Excel, либо брать большие интервалы измерений. Более точную формулу для подсчета достоверности данных я приведу позже.

С этим связана одна проблема, которая мешает пользоваться Google Analytics: при попытке отсортировать страницы по показателям наверх выходят самые непопулярные:



Понятно, почему это происходит, но эти данные бесполезны: у них нулевая точность. В зависимости от количества страниц, ключевых слов или других сегментов бороться с этим можно по-разному, я, честно говоря, не знаю метода лучше, чем экспортировать таблицу с сортировкой по убыванию показов в Excel, затем отрезать от нее «длинный хвост» и сортировать по другим полям.

Понятно, зачем это нужно: особый интерес представляют те сегменты, для которых один из этих параметров необычен: заметно больше или меньше значения для остальных сегментов. Обычно это происходит по следующим причинам:

— Отличие в трафике: пользователи, которые представляют данный сегмент, отличаются от других. Например, для интернет-магазина, работающего только на Москву, посетители из Екатеринбурга будут нецелевыми, и для них будет больше отказов, меньше достижения целей и ниже глубина просмотра.

— Отличия в качестве страниц. Если страница прячет от пользователя свое содержимое и не помогает ему понять, что можно сделать на сайте, не убеждает его в том, что нужно идти дальше, пользователь с большей вероятностью будет потерян для сайта. На западе persuasion design — целая дисциплина, но об этом позже.

— То, о чем многие забывают, пытаясь упростить модель взаимодействия пользователя с сайтом — соответствие целей пользователя, зашедшего на страницу, и содержания страницы. Типичной ошибкой подобного рода является использование главной страницы сайта в качестве входной (landing page) для рекламных кампаний. Кликнув по рекламному объявлению, сулящему скидку на определенный товар, пользователь может оказаться на главной странице большого магазина. В этом случае велика вероятность того, что он не захочет или не сможет найти то, что уже ожидал увидеть. Подобная ошибка происходит и тогда, когда в попытках заманить больше посетителей рекламодатель пишет на баннере «скидка 25%!», а на входной странице сайта «забывает» о своем предложении.

Рассуждая в этих трех категориях, можно создавать гипотезы и проверять их, увеличивая важные для сайта показатели.

В следующих частях мы поговорим о составлении плана анализа, построении предположений на основе статистики по каждому из основных параметров и их проверке.
+32
19 октября 2009, 16:33
102

комментарии (19)

НЛО прилетело и опубликовало эту надпись здесь
0
payalnik #
Об этом я немного говорил в предыдущих сериях :)
0
vdustinov #
Хорошая статья, понятная и правильная. Но удобней было бы обо всем этом рассказать на примерах. Попробую показать, когда такая статистика бывает полезна из своей практики:

— В списке популярных страниц видим, что у какой-то страницы (например, «Прайс-лист») показатель выходов больше 90% — повод посмотреть на эту страницу внимательней и что-то в ней изменить или переделать совсем по-другому

— В списке источников переходов видим, что некоторые рекламные кампании дают трафик с показателем отказов гораздо больше других. Если они при этом стоят столько же, это повод перераспределить бюджет в пользу кампаний с более качественным трафиком

— В списке браузеров видим, что пользователи %browser name% проводят на сайте в 5 раз меньше времени, чем другие — повод открыть сайт в этом браузере и ужаснуться:)
0
payalnik #
Спасибо. Дам примеры в следующей части, обязательно, она как раз будет этому посвящена :)
0
vdustinov #
Ещё важное, на мой взгляд, добавление: часто всю пользовательскую статистику лучше сразу смотреть со срезом по качественным источникам трафика (прямая реклама или основные целевые поисковые запросы). Дело в том, что на типичном сайте даже с 5-10 страницам через несколько лет набирается под сотню человек в день из поисковиков по левым запросам или ещё откуда-то. Они могут серьезно испортить статистику, если количество целевых посетителей, ради которых создавался сайт, сравнимо с объемом мусорного трафика.
0
payalnik #
А можно вот тут тоже пример? потому что такой шум есть всегда, даже с качественных источников.
0
vdustinov #
Думаю, самый показательный пример — сайт студии:
— 50 человек в день — мусор из поиска (например, переходы на страницы портфолио по названиям кампаний-клиентов)
0
vdustinov #
… самоотправилось раньше времени(
— 30-50 человек в день — переходы с сайтов клиентов по ссылки на копирайт. Уже лучше (эти люди заинтересовались тем, кто делал сайт, на котором они находятся), но тоже не совсем то. 99.9% этих людей покидают сайт на странице «Прайс-лист», но это не важно.
— 30-50 человек в день с Яндекс.Директа, например. Цена перехода зашкаливает за 150 рублей — вот ради этих людей и делался сайт — и статистика смотреть надо статистику только по ним. Если и среди этих посетителей 99% уходит с «прайс-листа», надо что-то кардинально менять (либо сайт, либо источник основного трафика, либо прайс:)
0
vdustinov #
Совсем от шума не избавиться. Но тут 2 варианта:
1. Данных для анализа достаточно, чтобы шум не мешал.
2. Данных для анализа настолько мало, что проще посмотреть поведение каждого посетителя собственными глазами с помощью вебвизора (там в комментах больше пользы)
0
Dronix #
Если определить источники шума самостоятельно (как в приведенном примере — мусор из поиска по опред. запросам), в Google Analytics можно настроить Расширенные сегменты и создать там правила.
Например, сегмент «Чистая аудитория»:
Правила: посетитель НЕ пришел по кейворду «газпром»
посетитель НЕ пришел по кейворду «кузбасс нефтегаз»


Потом можно выбирать этот сегмент и смотреть уже очищеную от основного шума аудиторию, от всего не избавиться, но придем к п.1
0
Psixozzz #
Объяните пожалуйста, это разве не одно и тоже по смыслу?

— Сколько процентов посетителей, начавших просмотр сайта с этой страницы, не перешли на другую, а сразу закрыли сайт (Показатель отказов)
— Сколько процентов посетителей закончили просмотр сайта на этой странице (% выходов).

и в том и другом случае посетитель заходит на страницу и закрывает/уходит с нее. Где я ошибся?
0
payalnik #
Показатель отказов — это те, кто открыл всего одну страницу. Для скольких она стала первой и последней.
А процент выходов — это число пользователей, для которых она стала просто последней, вне зависимости от того, что они делали до этого на сайте.
0
Valeratal #
Спасибо за статью, есть о чем подумать
0
maki #
«при попытке отсортировать страницы по показателям наверх выходят самые непопулярные» — наверное, «по показателям отказов»?
0
Dronix #
Опять же, для исключения из статистики «длинного хвоста» можно создать расширенный сегмент со следующими правилами:

Например, назовем его «Без длинного хвоста»

Показатель отказов НЕ РАВНО 100%
И
Страниц/посещение НЕ РАВНО 1

Включаем сегмент на просмотре статистики по тайтлам, и вуаля — данные чистые.
0
payalnik #
ойойой, зачем это вы отказы исключаете? Вы тут попали в причинно-следственную ловушку. То, что есть баунс, не значит, что трафик мусорный. Там еще две потенциальные причины
0
Dronix #
Да, Вы правы, наверное это слишком жестко, но тем не менее, мне кажется сегментами вырезать лучше, чем в экселе, т.к. это можно и на другие таблицы/графики распространять.
0
Quiz #
Побольше бы таких статей.
Спасибо! Очень полезный, на мой взгляд, материал.
Обязательно пишите ещё.
0
iChirva #
Боьшое Спасибо,
Хорошая статья, мотивирует изучать данные Google Analytic своего сайта.

Прямо хочется переврать философское изречение «Сократ мне друг, но cookiesы дороже » ;)

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.