Персональные блоги

индекс
0,00

Возраст человека можно определить по истории сёрфинга

Исследователи из компании Xerox нашли способ довольно точно определять возраст человека даже не спрашивая его — просто по истории сёрфинга. Такой метод может найти применение в онлайновых системах авторизации, в интернет-магазинах, а также везде, где желательно сохранить анонимность пользователя и провести проверку быстро. Это очень актуальная проблема, которая уже обсуждалась на Хабре.

Зарегистрированный патент содержит подробное описание такой системы, которая может определить возраст, пол и даже примерный уровень дохода пользователя. Для этого используется профилирование юзеров и последующее статистическое сравнение с большой БД поведенческих паттернов.

via New Scientist
+18
13 апреля 2007, 12:34

комментарии (22)

0
ferrozer #
Ага, "сохранить анонимность пользователя"!
Это какая же анонимность получится, если система будет записывать, куда юзер ходил?
0
alizar #
Его имя останется в тайне и паспорт не надо никому показывать.
0
ferrozer #
Зачастую по истории посещений можно, по крайней мере, с некоторой долей достоверности, определить человека. Блоги, форумы, социалки...
0
belgrad #
Тема не раскрыта - где хранится и как предъявляется к осмотру история серфинга?
0
AHTOH #
Как раз все понятно. Не важно, где хранится история серфинга. Речь о технологии, которая, возможно, пока не реализована. Главное в том, что сравнивая ваше поведение с типичными шаблонами поведения (заранее подготовленными) можно определить возраст, пол и примерный уровень дохода.

Что касается применимости метода, то историю серфинга семожно получить у любого сервиса счетчиков посещаемости, код которого расположен на многих страницах разных сайтов. Например, Rambler Top100, LiveInternet, SpyLog, Top Mail.Ru и пр.

Другими словами, Вы серфите, а служба счетчика вдруг понимает, сколько Вам лет и пр., дает эту информацию рекламной сети и рекламная сеть быстренько адаптирует свою рекламу под ваш тип поведения и заходя на следующий сайт Вы видите рекламу, подготовленную специально для Вас.

Вообще, со счетчиками можно определить не только возраст, но и интересы, распорядок дня, потребности и пр.
0
belgrad #
Ага, а идентификация пользователя как происходит? По IP?
0
AHTOH #
Методов идентификации много. Обычно идентифицируют по кукам. Но можно по IP и по уникальным настройкам веб-браузера, к примеру.

Смысл этой технологии в том, чтобы определять не "кто Вы", а "какой Вы". Ваша личность мало интересует рекламщиков, но ваши возможности, склонности, привычки, потребности и пр. - очень интересуют.
0
Vox #
Скажу за себя. Когда станет понятно, что технология заработала и куки статистических сервисов используются для этих вещей. Я их просто перестану хранить. А счётчики графические я давно отрезаю.
+2
brabadu #
И снова: "Добрый вечер, Большой Брат!"
Я вот вроде ничего секретного ни в инете, ни на машине у себя не держу, и мне на пользу должны бы все эти примочки быть, но все равно не хочется такой "сервис", который на меня смотрит и постоянно под меня подстраивается.

И вообще, не люблю тех, кто всегда подстраивается :)
0
AHTOH #
Ваш пусть по сайтам УЖЕ прослеживается счетчиками. Можно даже отчеты посмотреть, пути пользователей по страницам (какую страницу на каком сайте в какое время посетили и где задержались).
+2
bird2gt #
не совсем так
Прослеживается мой путь на каком-то сайте:
как я туда зашел, что посмотрел и на какой странице вышел.
Однако счетчик не ведет мой ip-шник от сайта к сайту,
тем более что не всех сайтах где я бываю есть одни и теже счетчики.

Подобной технологией занимается гугль, который, отслеживая запросы, содержание почты,
разговоры в Gtalk и что-то еще составляет этот паттерн и показывает мне релевантную рекламу.
Если гугль будет еще и отслеживать все страницы где я бываю (а ведь он их "читает")...
будет проще сразу заполнить подробную анкету добровольно :-(
0
AHTOH #
>Однако счетчик не ведет мой ip-шник от сайта к сайту,
Еще как ведет. Даже простой пользователь может, например в liveinternet.ru посмотреть не только с какого сайта пришел пользователь, но и на какой сайт он ушел. Учитываются временные рамки активности, IP и cookie счетчика (не сайта, который посещаете).

>тем более что не всех сайтах где я бываю есть одни и теже счетчики.
Это вот верно, но остаются косвенные признаки типа HTTP_REFERER.
Кроме того, нет необходимости целиком отслеживать ваш путь, достаточно знать некую заранее изученную последовательность ваших действий, пусть даже и с пробелами, чтобы сравнить ее с существующими типовыми поведениями и определить "какой Вы".
0
bird2gt #
Абсолютно согласен с Вами, пробелы, которые возникают при type-in переходах, можно закрыть типовыми паттернами, которые потом подстроют лично под меня.
Единственное что меня не радует - это то, что б не хотел, чтоб эти данные каки-либо образом покидали автоматические системы и были доступны людям. Но это невозможно.
0
AHTOH #
Type-in тоже отслеживается автоматически по cookie счетчика. Чтобы счетчики Вас не считали, нужно удалять их cookie перед переходом на новый сайт.

Кстати, Хабр устанавливает своих 6 кук (в том числе и реферальную для bobrdobr.ru :) Думаете зачем?
0
Vox #
Прикольней было бы делать полностью изолированные массивы cookie для каждого сайта.
0
brabadu #
Да, блин, понятно, что уже прослеживается.
Это как у Гришковца. Я жил и не знал этого, а теперь узнал и огорчился. Но ведь не знать этого я уже не смогу :)
НЛО прилетело и опубликовало эту надпись здесь
0
brabadu #
Adblock Plus с успехом режет счетчики вместе с баннерами.
0
iDev #
"Мы все под колпаком у Гугла",- подумал Штирлиц и закрыл Сафари.
0
Barouh #
ИМХО подобные решения могут работать для таргетирования рекламы (где большой процент ошибки неизбежен и приемлем)

Но для принятия решения по конкретному человеку, когда требуется большая точность, решение не может работать, поскольку всегда будет существенный процент людей, не укладывающихся в стандартные паттерны.

Можно придумать массу примеров нарушителей паттернов: внук помогает бабушке искать информацию про лекарства; извращенец облюбовал сайты для детей; маркетолог внимательно изучает сайты для тинейджеров. И т.д. и т.п.

Через трекинг посещаемых сайтов возрастную принадлежность (а равно пол, уровень доходов и т.д.) пользователя мождно определить лишь с определенной вероятностью. Авторизовывать Xerox будет тоже с определенной долей вероятности?
0
bidon #
Полностью согласен про примеры нарушения паттернов. Я вот, например, половину времени, которое провожу в Интернете, занимаюсь поиском лингвистических примеров (употребления слов, выражений и т.п.). Естественно, найдя в Яндексе нужное мне словосочетание или слово, лезу по ссылке, чтобы посмотреть контекст. Тематика сайтов при этом, понятное дело, произвольна. И если роботу подсунуть мои логи, он, думаю, подвиснет ))

Хотя с другой стороны, вероятно, таких примеров в общей массе пользователей единицы...
0
kr1 #
Что-то мне подксказывает, когда через 10-ок лет в рунет вольют действительно большие деньги, то демократия в сети закончится вместе с долей анонимности и начало этому положат такие программы.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.