войти зарегистрироваться

БлогосфераСтранные приёмы раскрутки с использованием чужих блогов

Нашёлся тип, который регистрирует домены по никам ЖЖ-юзеров и размещает там чужой контент с целью продажи услуг по раскрутке сайтов.

В июле-августе 2009 года зарегистрировал более 300 доменов второго уровня в зоне .ru с именами, представляющими собой (или очень похожими на) ЖЖ-ники различных пользователей.
Всех физически проверить сложно, но судя по всему, схема очень похожая. Типичный представитель: http://www.snake-elena.ru
Львиная доля контента утащена из реального ЖЖ реального блоггера, а ещё кусок («свежие» записи) — из другого реального ЖЖ.
Так, если snake_elena зайдёт почитать по диагонали — ничего криминального не увидит — вверху висят не её записи. Но если покопаться, то бОльшая часть сворована именно у автора «заглавного» журнала.
UPD3: Похоже начали удалять!!!

СМИ в интернетеКак отследить копирование контента?

Для большинства онлайновых СМИ остро стоит проблема воровства контента. Хочу обратить внимание на сервис Tynt. Он не спасёт вас от рерайта и наглого воровства, но поможет вам понять, какой контент на ваших страницах считается самым интересным, что копируют и куда вставляют простые пользователи. Кроме того, вы привлечёте дополнительный трафик к себе на сайт, получите больше ссылок. Как это работает?

LifehackСлушаем радио last.fm, бесплатно

Для всех любителей Last.fm сообщаю маленький хак.
Онлайн радио last.fm отлично слушается и скроблится в хорошем плеере Banshee (только Linux и OSX, впрочем можно попытаться собрать под win32 ) (лично я с момента введения ограничения прослушивания на 30 бесплатных демо композиций, прослушал порядка 400, и слушаю дальше, доказательство: www.lastfm.ru/user/neuotq (можно увидить отстутствие черной полоски обозначающей платного пользователя)).
enjoy.

upd: у кого таким же способом получилось/не получилось обойти ограничение отписываемся.

PS этическая часть этой(и подобных) фичи/бага под вопросом, и остается на совести пользователя. Я считаю что особых нарушений чьих либо прав при этом нет. Музыку мы не сохраняем(большинство), а только прослушиваем, и очередное разделение на белых и второсортных мне не нравится, и вообще звукозаписывающие компании иногда наглеют сверх меры, впрочем оно и понятно, принцип защиты собственных инвестиций никто не отменял.
Статьи типа этой inwebwetrust.org/trust/Last_fm_i_dranie_kapitalisti_.html (ссылка от Paranjko ), странные, предлагают не воровать тут, а воровать там.
А отговорки типа PayPall сложен в оплате конечно же немного некорректны, оплачивается легко и непринужденно с помощью большинства карт VISA

КопирайтЗащита контента от воровства: самый эффективный способ

Недавно на паре форумов, а также на «Хабре», всплыла тема защиты контента от копирования.

Что только не предлагали. И отключать правую кнопку мыши, и алерт выбрасывать при копировании, и джаваскриптом подгружать. В общем, много всего смешного.

Сейчас я расскажу вам про самый эффективный способ защиты контента вашего сайта.

Самый эффективный способ — предъявить миру какого-нить мудака, который ваш контент украл, а вы его засудили — заставили выплатить несколько тысяч евро и засадили в тюрягу. Ну или хотя бы условный срок. Или закрытие воровской конторы.

Причем лучше предъявить сразу двоих. Одного — более-менее крупного. Чтобы видели, что можете справиться. Второго — более-менее мелкого. Чтобы не надеялись, что до них дела не будет.

Вот это — самый эффективный способ защиты от воровства контента.

Все-таки, очень интересны мотивы граждан, которые сплошняком минусуют все каменты. Те, кто минусуют пост — понятное дело — убогонькие, считающие, что все, произведенное другими людьми, должно быть отдано им бесплатно.

Update: примеры успешной борьбы

Блог им. texnikruАвтоматический отстрел граберов или как избежать автоматического сграбления сайта

Я администратор доски объявлений и видимо усилия по поддержанию уникального контента (TBD – тема отдельного типика) не проходят зря т.к. я заметил нехорошую тенденцию к сграблению объявлений через RSS ленту, разбор html-страниц сайта т.е. контент серым личностям нравиться.

Как знают SEO-шники, подобное дублирование контента может негативно сказаться на ранжировании сайта т.к. чужой сайт может быть будет переиндексирован первым и стало быть будет единственным ревалентным в результатах поиска.

Первый и действенный метод борьбы – посмотреть в ping IP сайта, ворующего контент и заблокировать его, что помогало только первое время. Но иногда мне просто нехватало времени на выявление «воришек», да и некоторые сайты стали добавлять использование прокси-серверов.

Как настоящий программист я принялся искать автоматизированное решение и быстро нашел его. Достаточно вспомнить, что одним из важнейших различий вэб-сервера и компьютера пользователя в сети Интернет является наличие у сервера открытых портов, обслуживаемых HTTP/SMTP/POP-серверами. Т.е. если недопускать копирование контента с IP имеющих открытые наружу порты, то это будет хорошее препятствие.

Чтобы начать выявлять серых личностей и их сайты оказалось достаточно такого PHP-кода:

//$ip – это может быть $_SERVER["REMOTE_ADDR"] и $_SERVER["HTTP_X_FORWARDED_FOR"]
$fp = @fsockopen($ip, 80, $errno, $errstr, 1);
if( $fp !== FALSE )
{
//тут логируем, что данный IP имеет открытый HTTP-порт т.е. вероятно это сервер
}


Следует обратить внимание, что поле HTTP_X_FORWARDED_FOR устанавлиается в случае, если пользователь ходит через обычный прокси. Но это поле может быть и подделкой, поэтому нужно проверять IP как указанное в HTTP_X_FORWARDED_FOR, так и в REMOTE_ADDR.

Поскольку на доске объявлений происходит установка сессии для каждого посетителя, то проверка выполнялась только на 2-м хите для каждого уникального IP.

Пробный запуск скрипта на 1 сутки показал высокую эффективность – 4 сайта-грабителя были выявлены и обезврежены. Отловлено IP с открытым 80-м портов – более 2000! Поэтому для анализа IP использовался WHOIS сервис любезно предоставленный nic.ru и еще один скрипт. Ну что-же, у них защиты от автоматических сканеров нет и хорошо ;)

Теперь все, кто находятся в моем бан-листе получают текст объявления вроде «Данное объявление было незаконно скопировано с сайта xxxx, что является нарушением авторских и смежных прав. Пожалуйста, не пользуйтесь сайтами ворующими контент т.к. такие сайты могут использоваться для распространения скрытых вредоносных программ, а также могут собирать конфиденциальную информацию о вас.» ;)

Однако не стоит просто блокировать все IP имеюшие открытые наружу порты. Оказывается существуют домашние сети, где по 80-му порту открывается статистика прокси-сервиса (да, каждому гостю!), где детально перечислен список любимых сайтов этой аудитории с количеством хитов/Мб и кто сколько тянул…

Дополнительная информация:
  1. Для анализа хождений через прокси-сервера следует анализировать порты – 8080, 1080, 3126.
  2. Поиск дубликатов (имею премиум, личное мнение – сервис очень часто не прав) — http://www.copyscape.com/


Прошу Ваши идеи и комментарии в тред!

КопирайтВГТРК подала иск к Mail.ru за воровство видеоконтента

Всероссийская государственная телевизионная и радиовещательная компания (ВГТРК) вчера подала иск в Арбитражный суд Москвы к ООО «Мэйл.ру»: см. дела А40-69242/08-27-685 и А40-69243/08-51-601 на сайте суда. Иск связан с защитой прав на интеллектуальную собственность.

Как несложно догадаться, суть спора состоит в воровстве эксклюзивного контента телеканала «Вести» и других медийных проектов ВГТРК. Этот контент размещался на сайтах-агрегаторах, в том числе на Mail.ru.

По имеющейся информации, на ресурсах Mail.ru выложены целые фильмы, собственником которых является ВГТРК, сообщает «Интерфакс». Судя по всему, это первый в истории российского правосудия судебный процесс, связанный с воровством видеоконтента в интернете. Более того, как стало известно «Интерфаксу», аналогичные претензии, касающиеся незаконного размещения видеопродукции, были предъявлены со стороны ВГТРК и популярному социальному ресурсу «ВКонтакте.ру».

Блог им. mix2000О выдаче чужого контента за свой

В продолжении этой темы.

Сегодня наткнулся на одном сайте на опубликованную мной статью, которая была скопирована один в один, но рядом не было ничего, чтобы указывало на автора или на принадлежность оригинального контента к определенному ресурсу (то есть банально ссылка на источник, на Хабр).