Pull to refresh
0
ХостТрекер
Сервис мониторинга доступности сайтов

Google Analytics. Осторожно боты

Reading time 2 min
Views 24K

Столкнулись с любопытной проблемой. На графике визитов видна интересная «ступенька». Мы обрадовались всплеску посещаемости. Но после анализа, выяснилось, что это боты.

Если погуглить на тему «Google analytics и боты», в основном утверждается что боты не влияют на показания статистики в GA. Посыл такой — аналитика использует JavaScript для отслеживания посетителей. Боты, существа примитивные, JavaScript выполнять не умеют, и аналитикой соответственно не учитываются.

Давайте разберемся в деталях.

Анализ трафика


Заметив необычный всплеск, мы решили локализировать его источник. Оказалось:


Такой характер трафика мог быть, если в Цюрихе крупное локальное офлайновое издание написало о нас. В этом были большие сомнения. Мы продолжили «копать» дальше.

До уровня IP адреса GA дойти не позволяет. Пришлось заглянуть в логи вебсервера. Трафик шел с одного IP. По логам, стало ясно что это боты. Запрашивались две страницы. Бот судя по всему был продвинут, выполнял JavaScript на странице, сохранял куки. Делал по несколько визитов для каждой сессии. Маскировался под приличного посетителя.

Честно говоря, мы были удивлены, тем что, аналитика учла этот «мусорный» трафик. Поразмыслив, стало понятно, что фильтровать продвинутых ботов аналитике самостоятельно сложно. Тут вспомнили про функцию аналитики Intelligence Events. Аналитика показывается активность, которая выбивается из общей картины. Там действительно была отдельная запись которая связана с ботом. Нельзя сказать что информация там исчерпывающая, но почву для размышления дает.

Как противодействовать?


Первым делом попытайтесь найти источник трафика и его характеристики. В нашем случае, мы легко вычислили ботов, визиты были с одного IP. Если в работу включится ботнет, даже с несколькими десятками узлов, то определить такой трафик сложнее.

Отфильтровать можно двумя способами:
  1. Если боты вам не мешают, то ставьте фильтр по IP или ISP в GA (Admin -> Account -> AllFilters):



    После этой операции, трафик с заданного IP учитываться не будет. Плохо то, что почистить накопленные данные нельзя.

  2. Более радикальный способ, это закрыть доступ на уровне файрвола или конфигурации вебсервера.


Выводы


— Некоторые боты могут влияют на показания аналитики;
— Боты могут значительно искажать статистику в GA;
— Если в аналитике появилась странная активность — попробуйте выделить признаки этого трафика и убедится что это не боты;
— Загляните во вкладку «Intelligence Events», аналитика показывает сегменты трафика с нехарактерным поведением;
— Не поленитесь посмотреть в логи вебсервера, там можно найти больше полезной информации для анализа;
— Фильтруйте «мусорный» трафик.
Tags:
Hubs:
+13
Comments 24
Comments Comments 24

Articles

Information

Website
www.host-tracker.com
Registered
Founded
Employees
2–10 employees
Location
Украина