На днях читал
заметку про рекламу Вебальты. И сегодня мне надо было посмотреть на общение браузера с http-сервером. Случайно получилось так, что тест проходил на странице, куда я пришёл поисковиком. И случайно я обратил внимание на куки. Куки, ясное дело, содержали мой запрос. Куки имеют примечательные имена, я их видел и раньше на других сайтах, просто внимания не обращал. Очевидно, что это не баннерка куки поставила, потому что сайт для тестирования (postgresql.org) вообще баннеров не имеет.
Посмотрел, кто ещё такие куки использует, оказалось что таких сайтов прилично. Очевидно, что кто-то чужой не может поставить одинаковые куки на разных доменах, сделать это можно только используя JS, подключаемый через script src. А кто у нас стоит на всех (русских и нерусских) сайтах? Правильно, гугловские аппликухи.
Итак, что имеется на выходе? Гугл складывает в куку поисковый запрос, баннерка, подключённая точно так же (через script src), читает этот запрос и использует как хочет. Даже если крутилки никогда на сайте не стояло и она вдруг появилась, использование гугловских кук даёт возможность посмотреть поисковый запрос, приведший на этот сайт. Дальше мне разбираться было лениво, может быть в куках и guid какой-нибудь есть, сквозной для всех сайтов. Это было бы самым весёлым кто угодно может собирать сквозную статистику. Поэтому я просто поставил блокиратор Гугла, чтобы меня больше не считали.
Повлияет ли это как-то на показ мне рекламы Вебальты? Повлияет, конечно я уже пришёл к выводу, что надо найти adblock, который умеет блокировать абсолютно все JS с внешних доменов, чтобы не вводить их каждый раз вручную в фильтре.
комментарии (59)
Хочу ещё добавить, что блокировка Гугловской статистики здесь абсолютно лишняя. AdRiver читает реферер страницы тем же скриптом, что и выводит рекламу. Достаточно заблокировать показ рекламы.
То есть, пользователь пришёл вчера, крутилку поставили сегодня, а она всё равно знает, что за запрос был. В Вашем случае крутилка должна была быть _до_ того, как пользователь пришёл.
Моя заметка просто пересекается с заметкой по ссылке причиной исследования, а именно наличием поискового запроса в куке.
Примерно так же вставляется и код крутилки часто.
Техническая сторона на пальцах:
Гугл аналитикс на сайтах имеет такие же права, как и скрипты с сайтов. Потому что вставляется на страницу таким образом: <script src="http://www.google-analytics.com/urchin.js" type="text/javascript">
Благодаря тому, что он ставит куки для сайта, этим могут пользоваться и другие, например, некоторые баннерные крутилки.
Скорее всего, логины/пароли и прочие данные они уже хранят или будут хранить в других местах. Сопоставлять их между собой и с любыми другими моими данными можно через глобальный идентификатор уже внутрях Гугла.
Получить их можно просто подписавшись на сабмит всех форм страницы. Пользователь всё ввёл, нажал сабмит, Гугл собрал все введённые данные, отправил их к себе на сервер и вызвал настоящий обработчик сабмита. Всё довольно просто.
Снимаю шляпу. Провёл эксперимент, действительно есть такая дыра. Скрипт с чужого домена доступа к самой странице не имеет, а вот куки видит.
Коллеги, за что минусуете пост? Его нужно вверх продвигать!
Моя заметка в большей степени о том, что глобальность Гугла мне не нравится. Ну и немного о том, что данными Гугла могут пользоваться другие компании.
Меня пугает другое. Мы размещаем у себя на сайтах код всяких счётчиков. А они имеют полный доступ к нашим кукам. Пять баллов. Вот это действительно Большой Брат...
Да, они считают всех. Но максимум, что им доступно, это определить моё поведение (то есть, на каких страницах бываю). Получить какие-либо мои данные они не могут. А Гугл аналитикс может. И может собрать воедино вообще всё, что я ввожу на сайтах, все мои сообщения, все мои телефоны/адреса/счета и так далее.
А про многих других я писал ещё в заметке - найду блокиратор, который блокирует загрузку всех чужих JS.
P.S.: Насчёт SpyLOG не уверен, но какой-то из общедоступных сервисов точно.
1. Google Analytics
2. Google AdSense
3. Яндекс.Директ (точнее, MixMarket, который - для "розничных" продавцов)
4. SpyLOG
Это просто из тех, чьими услугами я пользуюсь или пользовался у себя на портале. Наверняка есть и многие другие.
Чтобы не могли, надо блокировать внешние JS скрипты.
Регистрация на сервисах Гугла к этому не имеет отношения.
Можно назвать это "паранойя", но надежда на лучшее с ожиданием худшего часто помогает в жизни от неприятных неожиданностей =)
Логины-пароли можно воровать не из кук, а из форм, которые я заполняю на сайтах с внешними скриптами.
На мой взгляд ситуация с Гуглом аналогичная. К тому же всегда можно посмотреть что делает скрипт гугла или я ошибаюсь?
Майкрософту мешают спецслужбы правительств стран, куда они отдают исходники на аккредитацию.
Гугл же никому ничего не должен. И Спайлог никому ничего не должен. И крутилки баннеров не должны. Рорер стоит на куче сайтов, ты когда-нибудь слышал, что с ними заключаются договора на тему несобирания данных пользователей? ;)
Посмотреть, что он делает, можно, только хрена с два ты увидишь =) Потому что они могут тебе давать скрипт один, мне другой, а кому-то третий. Их же код лежит на серверах, а не на компе.
Сорос продаёт оружие и никакой шумихи нет.
Если от Гугл аналитикс и ко, только блокировкой внешних JS. У меня сейчас стоит в FF плагин Adblock, блокирует только Гугл аналитикс. Как будет время и желание, найду способ блокировать все вшеншние скрипты.
С Оперой не знаю что делать. Это можно решать только на уровне браузера, а про Оперу я почти ничего не знаю в этом плане.
Вы забыли учесть одно, что бывают first party и third party куки. Google Analytics использует только first party куки, поэтому эти данные он не может расшаривать для других своих или сторонних сервисов. В отличие от всяческих Spylog'ов и т.д.
Подробно я описал в статье "Куки как счетчик посещений"
http://kpis.ru/2007/03/18/cookies_internet_counter.html
И статья по ссылке херня. Банальности и глупости. LiveInternet куки ставит для своего домена, а не для домена, на котором стоит счётчик, что вполне законно.