войти зарегистрироваться

PHPРелевантный поиск на php

Хочу поделиться с Вами, как можно сделать более менее хороший релевантный поиск по сайту с помощью php в связке с mysql.

Я видел много сайтов, на которых поиск идет по средствам деления фразы на слова и выводились результаты не те, которые нужны пользователю. Я решил написать скрипт, который будет выдавать результаты в более релевантном порядке.

GoogleКнопки Google "+1" на Хабре, юзерскрипты и улучшение поиска для себя и своего круга

Продолжаем месячник Google+.

Кнопок Google "+1" на Хабре пока нет. Но было бы желание — их можно поставить и протестировать с помощью юзер-скрипта. В статье показано, как устанавливаются кнопки "+1" юзер-скриптом и как меняются результаты поисковой выдачи Гугла при включении "+1" от своего аккаунта.

(на рисунке — это не монтаж, это реально работающий скрипт)

Персональные блогиВек Релевантности

image

Что будет следующим прорывом в социальном вебе?

Этот вопрос является чуть ли не самым любимым среди всех энтузиастов, посвящающих себя технологиям и Интернету. Общий тренд нащупан уже давно — переход от простых социальных сервисов к персонализированному и релевантному контенту.

Ключевым элементом этого перехода является возрастающее значение понятия «интерес», наряду с «социальный». Сегодня Facebook, Twitter и Google работают над доставкой конечному пользователю только того контента, который интересен его окружению, в то время как некоторые стартапы работают исключительно с интересами пользователей, не глядя на их «друзей».

Релевантность — единственное решение проблемы информационной избыточности.

Персональные блоги Подсчет общей релевантности

Хабралюди, подсобите, пожалуйста, с задачкой.

На входе имеем набор объектов с разным количеством свойств. По каждому свойству выполняется полнотекстовый поиск, на выходе которого имеем релевантность. Задача: подсчитать суммарную релевантность объектов.

Самое просто решение, подсчет суммы релевантностей всех свойств объекта, не подходит из-за того, что у объектов может быть разное количество свойств. Я склоняюсь к примерно такой формуле:
итоговая_релевантность_объекта = максимальная_релевантность_из_всех_свойств_объекта + средняя_релевантность_остальных_свойств_объекта. Но эта формула высосана из пальца. Наверняка, есть целый класс подобных алгоритмов. Подскажите, в каком направлении копать.

КраудсорсингКакова самая релевантная сортировка в лентах? По свежести!

Например, зачем нужен поиск по Хабру? Во многом для того, чтобы найти статью по принципу «я это недавно читал, где-то она должна быть». Сегодня я так искал свежий топик про SOAP и др. сайтовые API.

Уже в который раз замечаю, что для решения этой задачи приходится использовать… поиск в Google Reader. Он сортирует результаты по свежести (как и Google Mail, кстати), и это оказывается самым релевантным:



Для сравнения то, что выдает поиск этого же слова «SOAP» по Хабру (sphinx?).



Это натолкнуло меня на мысль, что в «ленточных» системах самый свежий ответ в результатах поиска и есть самый релевантный. Как считаете, так ли это?

Персональные блоги Загадочная релевантность

Интересно, чем руководствуется Яндекс, выводя в первой позиции вот такой сайт:


Настоящий сайт посольства при этом находится на 9 месте в выдаче.

В Google все вполне логично:

Персональные блоги Москвич 408 — это на 78.3% Opel GT.

Упоминание слова Opel в статье о Москвиче стало причиной появления советского автомобиля в результатах поиска по запросу «opel gt» в Wikipedia с релевантностью в 78.3%.

Персональные блогиYahoo экспериментирует с чужими ссылками на «морде»

На заглавной странице Yahoo теперь можно встретить ссылки, отправляющие посетителей не на другие разделы сайта, как это принято повсеместно, а на сторонние ресурсы. В компании уверены, что это будет способствовать повышению релевантности. Обозначенная на иллюстрации стрелкой ссылка ведёт на статью на сайте CrunchGear.



В настоящее время проводится проверка целесообразности такого шага. Вместе с тем, напомним, большинство крупных поисковиков не ставят ссылки на другие ресурсы на главных страницах, только если речь не идёт о рекламе.

via TechCrunch

Персональные блоги Яндекс vs Google

А вы обратили внимание, что Google лучше ищет?

Серьезно, когда требуется найти что-то, у Google на порядок лучше результаты выдачи.

Искал сервисный центр Мазда-СТО.

Яндекс выдает ссылки на каталоги.
Google - тоже. Но на 1-ом месте у него — официальный сайт центра.

И так постоянно.
Похоже, Яндекс слишком увлекся "пробками", "картами" и "фотками".
Скоро Гугл отхватит ещё пару процентов рынка поисковых систем России.

Примеры тут: http://podrabinek.com/2007/05/23/google-…

Поисковая оптимизацияФакторы, влияющие на релевантность блога в Google Blogsearch

В отличие от многих поисковиков по блогам, поисковик Google по умолчанию выводит результаты в зависимости от релевантности. Опубликованный патент даёт ответ на вопрос, в зависимости от чего ранжируются блоги в результатах поиска.

Позитивным для блога являются:
  • ссылки на блог в других блогроллах;
  • ссылки на блог с других сайтов, которые не являются блогами;
  • использование тегов для категоризации контента;
  • PageRank;
  • количество подписчиков на RSS блога;
  • кол-во переходов со страниц результатов поиска и т.д.

Негативно влияют следующие факторы:
  • публикация постов через короткие промежутки времени с чётким интервалом;
  • контент блога отличается от содержания RSS;
  • повышенное содержание ключевых слов, которые считаются «спамерскими»;
  • большое количество дублирующегося контента;
  • одинаковый или почти одинаковый размер постов;
  • ссылки на один и тот же сайт во многих постах;
  • большое количество рекламных блоков, баннеров и их расположение и т.д.
via