Пользователь
0,0
рейтинг
10 ноября 2008 в 00:46

Разработка → Боремся с ручным спамом в блогах при помощи Parasite Eliminator (с 10 ноября сервис открыт для всех желающих)

Итак, свершилось то, чего так долго ждали некоторые посвященные блоггеры. Я открыл для всех желающих Parasite Eliminator – сервис и плагин для Wordpress, благодаря которым в моих блогах нет ручного спама.

10 ноября 2008 года – это черный день российских блогоспамеров (у зарубежных будет другой черный день, я еще не знаю, когда сделаю международную версию плагина).

Как оно работает


Очень похоже на антивирус + файрволл. Есть черные и белые списки, которые можно обновлять с серверов (на случай DDoS есть резервный сервер). Списки хранятся локально, в них можно добавлять URL или же исключать оные. Можно даже свои сервера поднимать, если знать формат обновлений.

Кстати, сейчас в черном списке уже более 1000 доменов.

Новые комментарии «сканируются на лету». Если есть ссылка из черного списка, то комментарий отправится модератору или прямиком в спам. Особо отмечу, что мой плагин ничего сам не удаляет. Только помечает.

Если же спамерский URL нам неизвестен, то он все равно не будет показан поисковым системам. Пройдут те ссылки, которые есть в белом списке. Скажем, если доверяет блоггер паре десятков своих знакомых блоггеров, то адреса их блогов включает в белый список. И только эти URL будут показаны. Прочие будут скрыты до поры.

Есть и сканер всей базы. Скажем, успел кто-то проспамиться, пока в базе не было его URL. Это не повод оставлять мусор в блоге, даже если ссылки не были показаны. Можно запустить сканирование вручную или по расписанию. Будут проверены все комментарии в базе. Проверка, кстати, осуществляется очень быстро.

И пополнение базы теперь будет осуществляться еще быстрее. Участники сообщества бета-тестеров уже присылают мне спамерские URL из своих блогов. Образуется антиспамерская паутина: нагадил спамер в одном из блогов сети — его спамерские комментарии пропали отовсюду.

Пикантности ситуации добавляет то обстоятельство, что все спамерские URL, сплоги и целые сетки дорвеев, которые я вскрыл, будут переданы в «Яндекс», «Гугл» и другие поисковые системы. Если представители поисковых систем захотят получить алгоритмы вскрытия спамерских сеток, с удовольствием рассмотрю предложения.


Пока я лишь один раз сдал такую сетку, 30 дорвеев в зоне RU вылетели за один апдейт. Остальных сдам на днях, всех разом, чтобы эффект прочувствовали.

В мире жЫвотных


Есть и еще два механизма для отваживания спамеров: дрессировка и отпугивание. Для дрессировки гоблинов есть отличная фича. Испытать ее можно так: идите в этот пост и попытайтесь оставить там комментарий со ссылкой на www.test.spam ;-)

Универсальный патентованный графический отпугиватель блогоспамеров – тоже интересный артефакт, заряженный особой магией. Он будет набирать свою силу со временем. Чем больше блоггеров покажут спамерам такие значки, тем больше спамеров будут о них знать и обходить блог стороной. Проспамившись в защищенном блоге, можно попасть в черный список и лишиться сотен своих уже оставленных комментариев.

Первый в мире антиспамерский сервис для спамеров


Для убогих блогоспамеров тоже есть цацка. Красный список опасных блогов, который можно скачивать, и загонять в свои программы, чтобы не нарваться на блог, из которого прямой путь в черный список и на стол модераторам поисковых систем.

Как все начиналось


В свое время, когда я открывал «Микромаркетинг» или блог студии Made, я сразу же установил туда AuthImage и Math Anti-Spam соответственно. Автоматический спам не проходил зато спамеры косили под нормальных людей и писали, «как нечеловечески сложно» ввести слово из 4 букв.

Но появились недочеловеки, которые занимались ручным спамом в блогах. О заказчиках такого спама я уже писал в свое время. С упорством истинного дебила они пытались отложить свои личинки то в одном блоге, то в другом, то у моих клиентов.

Нужно было какое-то средство, которое позволило бы централизованно чистить от ручного спама сразу все мои блоги. Тогда я и решил, а почему бы не вести базу этих уродцев? Приходит спамерский комментарий, я URL в базу заношу, и все мои блоги становятся иммунными к этой каке.

Количество спамерских доменов ограничено, задача решаема силами даже одного человека. Поначалу я хотел использовать штатные средства Wordpress (там можно ввести домены в стоп-лист), но, увидев код движка, понял, что работать это просто не будет. Не сдюжит. Проверить, скажем, тысячу комментариев по нескольким тысячам доменов за время работы скрипта будет просто нереально.

Почитав про PHP и MySQL, да посоветовавшись с Алексеем и Иваном, приступил я к проектированию, попутно придумав и реализовав алгоритм раскручивания сплог-сетей, которому позавидуют «Яндекс» с «Гуглом».

Через некоторое время была готова первая версия для закрытого бета-тестирования.

Первые версии плагина работали весьма быстро, но иногда глючили. Вечная память комментариям в блоге Антона Попова, одного из первых бета-тестеров и слава бекапам, из которых комментарии были восстановлены.

Серьезные баги я устранил оперативно, и плагин работал на моих блогах исправно. В силу недостатка времени, я немножко его подзабросил, но вот за эти выходные усилием воли «дожал», наконец и сам плагин, и сайт плагина. Заходите, скачивайте, тестируйте.

Связка Math Anti-Spam и Parasite Eliminator работает великолепно.

Как вы можете помочь правому делу борьбы с ручным спамом в комментариях:


  • Тестировать на разных версиях Wordpress, в разных условиях. Сейчас работоспособность подтверждена в разных сборках, от 2.0.4 до 2.6.3
  • Отловить баги и уязвимости в Parasite Eliminator, если там такие еще остались.
  • Отловить неоптимальные места в коде.
  • Рассказать знакомым блоггерам, чтобы пользовались.
  • Рассказать знакомым спамерам, чтобы боялись.
  • Сделать обзор плагина у себя в блоге.
  • Присылать мне образцы спама с URL, которых нет в базе.
  • Сделать аналогичный плагин для других блоговых движков.
  • Принять участие в программе «Красный список».


Update: спамеры-то зашевелились!


Уже пакостить пытаются.

И еще в статистике появились заходы с закрытых спамерских форумов.

Update2: основной сервер даже не пингуется


Ну да на этот случай я предусмотрел запасной аэродром.

На этот период все установленные плагины автоматически переключаются на обновления с этого запасного сервера.

И, конечно же, зайти и скачать плагин с «Народа» можно и сейчас.

Оказалось, что это не DDoS, а в датацентре меняют большую и важную железку. Другого времени не нашли.
Алексей Новиков @Novikov
карма
249,0
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Спецпроект

Самое читаемое Разработка

Комментарии (121)

  • +2
    Ммм… интересно…
    Читая статью с начала думал что вы «изобрели велосипед» сделав просто русский аналог Akismet, а оказалось что у вас оно вроде бы поинтересней реализовано. Думаю что у вашего проекта большое будущее, а с ним и у Российской блогосферы ;)
    • +2
      Недостатки Akismet отчасти и вдохновили меня. У моего плагина есть важное преимущество — он помечает как спам только то, что заведомо спамерское. И еще, не зависит от чужого сервера, не тормозит, так как списки собираются локально в каждом блоге. И эти списки можно править. И еще два механизма фильтрации.

      Но главное — в моих блогах действительно нет ручного спама (поначалу, правда, специально ломились, чтобы «показать неэффективность».)
  • +7
    Кстати, в одном из блогов сразу после установки плагин выгреб более сотни спамерских комментариев.

    А вот пример типичного убитого спамом комментирования:
    ownthesite.ru/2008/05/11/wordpress-251-lecactus/#comments
  • 0
    хоть от спама я и спасся, но протестю и этот плагинчик.
    А конфликтовать с включенным Akismet не будет?
    • +1
      Не знаю :) Я на всех блогах своих первым делом сносил Akismet ввиду тормозов и ложных срабатываний.

      Мой плагин ничего не стирает, только помечает как спам комменты, содержащие спамерские ссылки. Разве что Akismet сам прибьет то, что отправлено на модерацию было.
      • 0
        хы, поставил Ваш плагин, и у меня появился комментарий к последней записи, Ваших рук дело?
        • +1
          Да :-)
          • 0
            а, наверно у вас ведется база сайтов где установлен плагин?
            • +5
              Не, базы нет, просто при обращении за обновлением мне идет referer. Таким образом, я могу видеть, какие версии плагина где стоят, и если вдруг (мало ли) появится критическая уявзимость — я смогу связаться с пользователями.
      • 0
        по поводу Akismet, у меня он помоему ложно ниразу не срабатывал, спама отсеил порядка 1500 сообщений, но как только я поставил плагин Raven's Antispam спама в целом стало значительно меньше, пару сообщений в неделю
  • +3
    Я недавно писал про то, что и крупные организации занимаются спамом.

    По-моему, нужно просто исключить поле URL в комментариях как класс. Зачем оно нужно? Если кто-то захочет дать линк на свой сайт, он его даст в поле письма. А втыкать его в каждый комментарий не нужно.
    • +7
      Не нужно исключать это поле. Вот из-за спамеров подрывается одна из основ блогосферы. Это поле — для связей между интересными блогами, а не для спамерских ссылок. И теперь вот из-за мудаков-спамеров и поисковики снизили значимость ссылок с блогов, и народ вынужден отключать поле URL.
      • +5
        Такой вопрос: я добросовестный блоггер. Я прихожу в чей-нибудь блог и оставляю комментарий, указывая ссылку на свой блог.

        Человек по ошибке принимает меня за спамера и помечает мой сайт как спамерский. Заодно из Яндекса благодаря вам вылетают два десятка зарегистрированных на меня же доменов, ни один из которых никогда не рекламировался спамом.

        Какая защита от возникновения подобных ситуаций? Ведь здесь одно «ложное срабатывание» — смерти подобно.
        • +3
          Тут защита многоступенчатая. Он может пометить вас как спамера, но при этом только для своего блога, локально. Он и так может ваши комментарии стереть у себя.

          Если же ссылка приходит мне для добавления, я сперва ее ставлю на рассмотрение. Если это не явный дорвей, сплог и т.п., и есть сомнения — я ее не включаю в черный список.

          И ссылки принимаются только от доверенных блоггеров. А у меня есть целая сеть «ловушек», куда идиоты-спамеры сами фигарят свои домены, думая, что всех перехитрили ;-)

          Другие ваши домены никуда не вылетят, кстати. Ведь база спамеров — это база доменов, по которым спамят.
          • +5
            ОК, тогда другой вопрос. У меня блог/сайт с хорошим, качественным контентом. Я просто хочу новых читателей и больше тИЦ. Нанимаю тех же рассылателей ручного спама.

            Вы по наводке идете проверять мой сайт, но обнаруживаете вполне интересный блог, СДЛ. Сайт идет в черный список или нет?
            • +1
              )))
              я бы отправил в черный список
              • +2
                1) Если в черный список, тогда как отличить добросовестных активных блоггеров, которые действительно просто рассылают много комментариев?

                2) Если в белый список, то значит, ukr.net будет спокойно продолжать спамить в блогах? Ведь это крупнейший интернет-провайдер и портал.
                • +1
                  Прочитайте про новое отношение к полю «Ваш сайт».

                  Если коротко — то я предлагаю его расценивать не как вознаграждение комментатору, а как способ отправить автору блога свой блог для ознакомления. И, если автор блога сочтет нужным, то откроет ссылку для своих читателей через механизм «белого списка».

                  ukr.net — не блог, добросовестным блоггерам незачем его вставлять в комментарии. Так что, однозначно в газенваген.
                  • +2
                    Ведь даже если это кто-то спамит против ukr.net — сам ukr.net ничего не потеряет. Ведь он блога не ведет, а если сам не спамил — так и не должен был появляться там в комментариях.
            • +3
              Буду по ситуации смотреть. Не исключено, что таким образом и подставить пытаться будут.
    • 0
      так это поле не обязательное, не хочешь — не заполняй
    • 0
      А если мой УРЛ это openID? То я просто не могу оставить коментарий как «зарегистрированный» пользователь.
  • +2
    когда сделаю международную версию плагина


    Могу бесплатно сделать вам перевод плагина/сайта. А в иностранных блогах вообще есть такая проблема?
    • +1
      Есть у них и такая проблема. С международной версией там чуть посложнее, чем просто перевести. Надо переделать плагин под файлы локализации и т.п. За предложение благодарю, буду иметь в виду, когда придет пора :-)
  • +3
    не долго он «ламался», как по мне…
    • +1
      Кто? :)
      • 0
        ну я там порно ссылочку запостил которую уже неспешно кикасснули
        ну и так пару словечек добавил из простого набора :)
        • +1
          Так плагин не от порноссылок и не от стоп-слов :-) Хотя, запросто можно будет доработать.
    • +2
      Не минусуйте deerua
      • +1
        Т.е. это я прошу присутствующих не минусовать deerua
  • +3
    Свой блог не веду, спамом не занимаюсь, но хотелось бы отметить очень хороший дизайн сайта parasite-eliminator.ru, а так же хороший юмор в текстах.
    Приятно смотреть на такую работу)

    P.S. единственное что — домен ваш запомнить просто нереально:) По крайней мере, для меня.
    • 0
      Все целиком делал своими руками — от текстов и оформления до программирования и сбора базы :)
      • 0
        И красавица, и умница, и мастерица на все руки =)
        В плане оформления порадовало отношение к типографике и безумно порадовала иконка «fuck off spamer» =) Вобщем молодец, как всегда (давно уже отсылаю заказсчиков за «где можно почитатать доступно на эту тему?» на микромаркетинг).
    • +1
      Дизайн прикольный. А тексты злые какие-то.
      • 0
        Веселые)) Так и надо, мне нравится.
  • +1
    Звучит как минимум интересно. Протрезвею — буду пробовать ^__^
  • 0
    Well done, commander.
    Срочно приобретите оружие самообороны. У меня плохое предчувствие…
    • +4
      Уже есть. Кстати, блогоспамеры зашевелились.

      Добавили электронную почту Parasite Eliminator в скрипт, который сейчас проходится по куче разных форумов и регистрируется там, оставляя наше мыло. Ну да это не страшно. Ящиков я могу заводить сколько угодно, а почту с радостью принимают сервера и антиспамерские фильтры «Гугла».

      Сейчас идет 2-3 письма в минуту. Такими темпами скоро у меня окажется вся их база уязвимых форумов. Вот и монетизация сервиса ;-)

      И еще в статистике появились заходы с закрытых спамерских форумов.
      • 0
        ХА, так вы работаете аки почти что спамеры :)
        Заспамили спамеров своим мылом в форумах
        • +1
          Так это не мы, а спамеры добавили.
          • –1
            >>Добавили электронную почту Parasite Eliminator в скрипт, который сейчас проходится по куче разных форумов и регистрируется там, оставляя наше мыло

            Я не имел в виду стопроцентного спамерского сходства…

            Спамеры оставляют сообщения на форумах, чтобы потом поисковые системы их индексировали…
            для этого они
            1) автоматически регистрируются на форумах
            2) оставляют спам-сообщения

            Вы же скриптом нарегили экаунтов чтобы спамеры проиндексировали Вас :)

            ЗЫ
            Только не надо минусовать, это ж не в укор сказано, я просто сравнил (при чем не без юмора)
            • +1
              Это не я нарегил, а спамеры :-) Чтобы забить мой ящик 1500 писем.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +2
      Обновления есть уже несколько месяцев, там более 1000 доменов спамерских уже. Просто я, выкладывая ссылочку на запасной аэродром, опечатался. Но уже поправил, спасибо.

      Установленные плагины же без проблем скачивают, что надо, я как раз отслеживаю работу ;-)
  • +1
    вот так канает: www.test.sp%61m :))
    • +1
      А поисковым системам это проканает? :-)

      В любом случае, спасибо за наводку ;-)
      • 0
        ну не знаю, проканает или нет (Надо подумать. Возможно даже, что да).
        Задача была оставить комент с линком на определенный сайт :)
        • +1
          У спамеров задача оставить комментарий с линком, который будет проиндексирован роботами.
        • 0
          Вполне проканает. Как по вашему индексируются ссылки вида ru.wikipedia.org/wiki/Спам?
          • 0
            ну значит вариант, предложенный мною подходит :)
            (пока автор не закрыл эту фишку)

            Ситуация не в том, что он проиндексирует эту страничку, главное чтобы
            количество проиндексированных адресов www.test.sp%61m добавляло рейтинга (ПР и ТИц) домену www.test.spam
            я в этом не был уверен.

            чтобы не было чего-то типа такого результата поиска:

            www.test.spam — spam bla bla bla

            www.test.sp%61m — spam bla bla bla

  • 0
    пожалуй стоит попробовать заменить akismet, хотя проблем у меня с ним пока не было
  • +7
    А вы специально совместили чёрный день российских блогоспамеров с днём милиции?
  • 0
    Я решил проблему проще. Так как само содержание спамерского комментария вполне позитивно, я просто отключил подстановку ссылки под ником, теперь спамеры работают на меня =)
    • +5
      Вряд ли информационный шум и тупая лесть, используемая спамерами, могут быть полезны и хороши для обычных читателей. Там, где прошлись спамеры, нормальные обсуждения не появляются.
      • 0
        А обычные читатели разве всегда пишут умно и правильно?
        • 0
          Нет, но они «returning customers», в отличии от (: А не прилетело НЛО, написало: «Клевая статья, я как раз интересовался» под цитатой с Баша и исчезло на веки веков (: Такой комент впечатление производит феерическое (о;
  • 0
    Круто… Блог Миколки и мой собственный блог помечены как спаммерские. Оба — качественные блоги.
    • +1
      убрал zybc и mikolka из списков
      • +1
        а как они туда попали?
        • +1
          Скорее всего, когда я зашел на их сайты, то не отличил от сплогов :) Так бывает.
        • 0
          Но вот за весь период пока только 5 или 6 ложных внесения в блеклист из > 1000
    • +1
      Он пометил alexnote.ru?
  • +1
    Огромное спасибо, пользуюсь ещё с тех закрытых тестовых версий, очень нравится этот плагин. Каюсь, уже думал, что больше не будет развиваться :(
  • 0
    Ага. Спасибо.
    Я, кстати, в блоге у вас спросил, что делать, если кто-то решит подставить кого-то (были случаи) и начнет спамить от чужого имени? В акисмет есть возможность блоггерам вытаскивать из «спама» комменты, и впоследствии они будут и на сервере акисмета помечены как «не спам». А здесь нужно писать автору по каждому случаю, или наши локальные списки могут как-то использоваться?
    • 0
      Тут есть несколько вещей:

      1. Локально вы можете добавить все, с чем не согласны, в список исключений, но это будет, правда, только для каждого блога в отдельности.

      2. Я сделаю механизм, который позволит при следующих обновлениях баз вытаскивать из спама ошибочно внесенные комментарии.

      3. Пока нужно будет писать мне, но до сих пор, за несколько месяцев закрытого тестирования, только 2 или 3 домена оказались ошибочно внесены. И вот сейчас еще 2 нашлось. В остальных же случаях выяснялось, что ошибочно были оставлены спамерские комментарии, написанные «по теме», но ради очередной ссылки на очередной дорвей по строительной тематике.
  • 0
    Не понимаю из-за чего столько сложностей. Неужели не проще сделать редирект или выводить поле URL, скажем javascript-ом или и то и другое?
    • +3
      Дело в том, что тупые спамеры гадят даже тогда, когда все ссылки заредирекчены и закрыты по самые гланды. В блоге появляется мусор, который просто массой душит нормальные обсуждения.

      Вот пример:
      ownthesite.ru/2008/05/11/wordpress-251-lecactus/#comments
      • 0
        насколько я заметил тут всего лишь nofollow, который даже не факт что влияет на что-то.
        • +3
          Не, тут не в контексте SEO говорю. Вы посмотрите, там же просто нет нормального обсуждения — из-за спамерских отбросов ему просто не пробиться!
  • 0
    Была мысль сделать подобную сеть(спам/реклама) на базе торрента: где центральный сервер позволяет соединятся клиентам между собой для синхронизации списков, плюс рейтинги/доверие к ссылкам.
  • 0
    А как насчёт API, чтобы можно было сделать плагины не только для WordPress, но и для других систем?
    • +2
      Там даже API не нужен. Надо только формат списков знать. Люди вот импортируют даже в Movable Type
  • 0
    Алексей. Я уже поломал твой антиспам. :)
    • +1
      Опишите :-)
      • 0
        В привет мире предпоследний комментарий. Ну или уже не предпоследний, проще искать по моему нику.

        Заменил букву «a» в адресе на HTML Enitity. Все работает. Вот и вся магия.
    • +1
      А, фишка с заменой букв на последовательности типа a уже в разработке :-)
      • 0
        Ну, тут немного другой вариант подмены, так что его тоже учтите. :)
        • +1
          Учтем. Что посоветуете? :-)
          • +1
            Я так понял, что у вас там PHP, хотя это не суть важно, т.к. в других языках тоже есть варианты решения, но для PHP: html_entity_decode — для моего варианта, url_decode — для предыдущего варианта.
            • +2
              Так и буду делать. Скорее всего, придется делать какой-то фильтр, который при сохранении будет конвертировать такие штуки в обычные.

              Или предупреждалку, обнаруживающую такие фокусы и бьющую тревогу.
  • 0
    Спасибо, сегодня попробую, отпишусь, как работает
    • 0
      Хочется более удобного способа пополнения баз :)

      Если я помечаю в WordPress комментарий, как спам, он может автоматически заносится в чёрный список?
      • +1
        Более удобный механизм будет чуть позже, сперва разберусь с тем, насколько серьезна лазейка с подменой символов в домене. Жду ответа от поисковиков. Надеюсь, что искаженные таким образом домены просто не будут учитываться :)
        • 0
          Насколько я понимаю, тут есть 2 способа: на уровне HTML текст может быть заменен на html-entities(& something; и & # code ;), и в УРЛ тоже можно кожировать символы через urlencode()
  • +2
    Очень интересная статья. Добавил в закладки.
    • +4
      это сообщение очень похоже на спам :D
      • +4
        Очень :-)
  • +1
    Здорово)) Порадовало злобное, но с юмором отношние к спамерам. Хотелось бы, чтоб интернет уже стал чище, и чтоб всех этих поганых черных СЕО-шников уже забанили окончательно, вместе со всеми их дорвеями.

    А заодно все долбаные линкопомойки, сплоги, и прочий хлам, который генерируют через РСС, а также СДЛ, которые бедные копирайтеры в поте лица за копейки делают.

    Ну и отдельно (особо жестоко;) надо банить всяких SAPE-шников))

    > И еще в статистике появились заходы с закрытых спамерских форумов.

    )) Боятся или просто интересуются? Может их IP тоже на всякий пожарный записать?

    p.s. А ведь вроде на ссылках в комментах ставят nofollow, в чем смысл спамить? Заманивать народ? И нафик тогда плагин, если для заманивания народа ссылку можнотпробелаимт писать, или через tinyurl
    • +1
      Дело в том, что спамеры даже не смотрят, есть ли nofollow, noindex и пр. им пофигу — они тупо фигачат автоматом. От таких у меня капча. Чтобы капчу обойти — нанимают гоблинов. Гоблины получают за количество — тоже плюют на нофоллоу :) Но от них помогает мой плагин.
      • 0
        Кстати, математический плагин (на тестовом блоге), по моему — фигня, можно же фигачить числа рандомом процентов 10 пройдет.
        • +1
          два числа, от одного до десяти. Двадцать вариантов суммы. Один из двадцати — это 5% по рандому. Но пока что ни одного не проходило.
  • 0
    А насколько реально прикрутить к совсем другому блогу? Скажем, я вообще странный человек и предпочитаю вести блок в связке плагинов blog и discussion в DokuWiki. (Я действительно именно такой странный человек, мне очень нравится, как написана DokuWiki— это очень качественный объектный код со всеми вытекающими. А ещё он без СУБД, в плей-текстовых файлах всё хранит, и не тормозит. Короче, мечта.)

    Возможно ли появление API вроде того, как сделано на recaptcha (там регистрируешься, получаешь у них персональный криптографический ключ...)?
    • +1
      Как к другому — не знаю, все-таки, использованы специфические для Wordpress функции, его API.

      Но вот на problog.ru человек написал, как в Movable Type списки импортировать.
  • 0
    Потрясающе! Novikov, большое спасибо за этот проект! Я давно мечтал о подобном сервисе. Желаю больших успехов!
    • +2
      На здоровье. Мы его еще сейчас и улучшим, и прокачаем.
  • 0
    Novikov, большой респект за вклад в борьбу с гоблинами, но имеется вопрос.

    Допустим, какой-то нехороший человек решил подставить своего конкурента и нанял несколько школьников, которые днями и ночами спамят ручными коментами в белых блогах, обходя капчи и «12+4». При этом в кач-ве урла оставляют сайт жертвы.

    Как вы хотите бороться с такими ситуациями?
  • 0
    Давно подумывал о таком счастье)))) Приму активное участи в развитии, у меня спам резервируется))))) Раскидаюсь только с текущими проблемами!
    Спасибо за сервис и плагин!
  • 0
    Как я понимаю, для реализации минимального функционала для своего блога мне нужно сделать:
    1) проверку текста и урла комментария на нахождение в черном списке
    2) проверку урла комментария на нахождение в белом списке
    3) обновление списков с сервера

    Так? Или надо еще добавление урлов в список при подтверждении спамности? Пробежав код «по диагонали», я не нашел там отправки списка на сервер — оно там есть? Или я просто давно не брал в руки PHP? :)
    • +2
      Там есть несколько функций:
      1. проверка новых комментариев сразу при добавлении
      — по черному списку
      — по белому списку

      2. сканирование всей базы
      — по черному списку
      — по белому списку

      3. фильтрация URL с имени комментатора, если URL нет в белом списке

      4. обновление списков с сервера

      5. ручное добавление в локальные ч и б списки

      6. локальные исключения из ч и б списков

      Еще собираюсь добавить функциональность по извлечению из спама ошибочно добавленных комментариев.

      Пока удобной функции отправки на сервер нет, шлют мылом :-) Но будет, как только разберусь с более важными вещами.
      • 0
        Спасибо, попробуем сваять :)
  • +1
    Я уже вижу как спамеры пишут парсеры, которые ищут «графические отпугиватели» и вычищают свои базы.
    • +1
      Для них есть специальный сервис. Красный список — первый в мире антиспамерский сервис для спамеров. Даже парсить не надо — мы сами им говорим, что не надо нас трогать.
      • 0
        А вас не смущает что недовольный спамер возьми да проспамит по вашему красному списку, но не сцелью проставить ссылку — а так с целью просто поспамить — чтобы нагадить в каменты, а блогеру потом вычищай мусор, а спамер он не один и не одно сообщение пошлет, а сразу 100-1000 сообщений — в объщем мусора может падать по несколько десятков тысяч сообщений в день.
        Может не нужно этот список вывешивать?
        (спамит без ссылок — такчто фильтр не сработает)
        • +1
          Блоггеры, наоборот, сами просятся :-)

          да, не исключено, что некоторые, особо ущербные ментально кастрированные спамеры будут гадить специально. но практика показывает, что это не критично, надолго их не хватает, а автоспам можно будет заворачивать ;)
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      1. Сперва спамеры спамили мои блоги. Это были первые спамеры в списках.
      2. Затем я придумал способ вскрывать спамерские сетки превентивно.
      3. Потом я искал спамерские комментарии у знакомых блоггеров.
      4. Теперь присылают мне на рассмотрение.

      Я все просматриваю своими глазами, в спам отправляются или явные сплоги да дорвеи, или иногда попадали блоги оптимизаторов, рекламировавших софт для генерации дорвеев. Впрочем, последних я уже разбанил.
  • 0
    Умм, а как с url shortner сервисами? вот я прогнал test.spam через tr.im и комментарий прошел. Если спам ручной, то конвертировать УРЛ проблемы не составит.
    • 0
      Спам в основном для SEO — ссылки такие никому не нужны будут, а посещаемость есть более простые способы нагнать
      • 0
        Ну так ссылки в комментариях практически везде с nofollow…
        • +1
          Яндекс на него чихал. Кроме того, если уж блог в базе спамеров, то можно нофоллоу ставить — им по фиг. Они хозевам показывают, что линк стоит, и все.

          Поэтому плагин в качестве одной из фич имеет фильтр и дрессирующий механизм.
        • 0
          а noindex?
          • +1
            А спамерам по фигу. Блог в базу внесли — и дальше фигарят. Помогает только жесткая фильтрация автоспама (капча) и страх быть сданными в поисковики.
    • +2
      Такие URL спамерам оставлять смысла нет. Они ж себе накручивают тиц и пейджранк, а не сервису трим.
  • 0
    Так-с, у меня уже было первое боевое срабатываение :)
    Продолжаем поподнение базы спам URL
  • 0
    10 срабатываний с ходу+) Супер=)
    • +1
      Это сканер по прошлым каментам или фильтр по новым отработал?
      • 0
        Когда ставил — было 10 непроверенных комментариев (у меня все в модерацию идут) — и все отметил как подозрительные=)
  • +1
    А в коде плагина function npe_сurl_is_allowed() буква C должна быть русской? :)
  • 0
    Спам Карму отключать надо
    2.3.3 — не работает. Активирую — виснет.
  • 0
    Правильно ли я понимаю, что плагин сдох? База уже много лет не обновляется. :(

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.