PHP → Релевантный поиск на php
Хочу поделиться с Вами, как можно сделать более менее хороший релевантный поиск по сайту с помощью php в связке с mysql.
Я видел много сайтов, на которых поиск идет по средствам деления фразы на слова и выводились результаты не те, которые нужны пользователю. Я решил написать скрипт, который будет выдавать результаты в более релевантном порядке.
Я видел много сайтов, на которых поиск идет по средствам деления фразы на слова и выводились результаты не те, которые нужны пользователю. Я решил написать скрипт, который будет выдавать результаты в более релевантном порядке.
Google → Кнопки Google "+1" на Хабре, юзерскрипты и улучшение поиска для себя и своего круга
Продолжаем месячник Google+.
Кнопок Google "+1" на Хабре пока нет. Но было бы желание — их можно поставить и протестировать с помощью юзер-скрипта. В статье показано, как устанавливаются кнопки "+1" юзер-скриптом и как меняются результаты поисковой выдачи Гугла при включении "+1" от своего аккаунта.

(на рисунке — это не монтаж, это реально работающий скрипт)
Кнопок Google "+1" на Хабре пока нет. Но было бы желание — их можно поставить и протестировать с помощью юзер-скрипта. В статье показано, как устанавливаются кнопки "+1" юзер-скриптом и как меняются результаты поисковой выдачи Гугла при включении "+1" от своего аккаунта.

(на рисунке — это не монтаж, это реально работающий скрипт)
Персональные блоги → Век Релевантности

Что будет следующим прорывом в социальном вебе?
Этот вопрос является чуть ли не самым любимым среди всех энтузиастов, посвящающих себя технологиям и Интернету. Общий тренд нащупан уже давно — переход от простых социальных сервисов к персонализированному и релевантному контенту.
Ключевым элементом этого перехода является возрастающее значение понятия «интерес», наряду с «социальный». Сегодня Facebook, Twitter и Google работают над доставкой конечному пользователю только того контента, который интересен его окружению, в то время как некоторые стартапы работают исключительно с интересами пользователей, не глядя на их «друзей».
Релевантность — единственное решение проблемы информационной избыточности.
Персональные блоги → Подсчет общей релевантности
Хабралюди, подсобите, пожалуйста, с задачкой.
На входе имеем набор объектов с разным количеством свойств. По каждому свойству выполняется полнотекстовый поиск, на выходе которого имеем релевантность. Задача: подсчитать суммарную релевантность объектов.
Самое просто решение, подсчет суммы релевантностей всех свойств объекта, не подходит из-за того, что у объектов может быть разное количество свойств. Я склоняюсь к примерно такой формуле:
итоговая_релевантность_объекта = максимальная_релевантность_из_всех_свойств_объекта + средняя_релевантность_остальных_свойств_объекта. Но эта формула высосана из пальца. Наверняка, есть целый класс подобных алгоритмов. Подскажите, в каком направлении копать.
На входе имеем набор объектов с разным количеством свойств. По каждому свойству выполняется полнотекстовый поиск, на выходе которого имеем релевантность. Задача: подсчитать суммарную релевантность объектов.
Самое просто решение, подсчет суммы релевантностей всех свойств объекта, не подходит из-за того, что у объектов может быть разное количество свойств. Я склоняюсь к примерно такой формуле:
итоговая_релевантность_объекта = максимальная_релевантность_из_всех_свойств_объекта + средняя_релевантность_остальных_свойств_объекта. Но эта формула высосана из пальца. Наверняка, есть целый класс подобных алгоритмов. Подскажите, в каком направлении копать.
Краудсорсинг → Какова самая релевантная сортировка в лентах? По свежести!
Например, зачем нужен поиск по Хабру? Во многом для того, чтобы найти статью по принципу «я это недавно читал, где-то она должна быть». Сегодня я так искал свежий топик про SOAP и др. сайтовые API.
Уже в который раз замечаю, что для решения этой задачи приходится использовать… поиск в Google Reader. Он сортирует результаты по свежести (как и Google Mail, кстати), и это оказывается самым релевантным:

Для сравнения то, что выдает поиск этого же слова «SOAP» по Хабру (sphinx?).

Это натолкнуло меня на мысль, что в «ленточных» системах самый свежий ответ в результатах поиска и есть самый релевантный. Как считаете, так ли это?
Уже в который раз замечаю, что для решения этой задачи приходится использовать… поиск в Google Reader. Он сортирует результаты по свежести (как и Google Mail, кстати), и это оказывается самым релевантным:
Для сравнения то, что выдает поиск этого же слова «SOAP» по Хабру (sphinx?).
Это натолкнуло меня на мысль, что в «ленточных» системах самый свежий ответ в результатах поиска и есть самый релевантный. Как считаете, так ли это?
Персональные блоги → Загадочная релевантность
Интересно, чем руководствуется Яндекс, выводя в первой позиции вот такой сайт:
Настоящий сайт посольства при этом находится на 9 месте в выдаче.
В Google все вполне логично:
![]() |
Настоящий сайт посольства при этом находится на 9 месте в выдаче.
В Google все вполне логично:
Персональные блоги → Москвич 408 — это на 78.3% Opel GT.
Упоминание слова Opel в статье о Москвиче стало причиной появления советского автомобиля в результатах поиска по запросу «opel gt» в Wikipedia с релевантностью в 78.3%.
Персональные блоги → Yahoo экспериментирует с чужими ссылками на «морде»
На заглавной странице Yahoo теперь можно встретить ссылки, отправляющие посетителей не на другие разделы сайта, как это принято повсеместно, а на сторонние ресурсы. В компании уверены, что это будет способствовать повышению релевантности. Обозначенная на иллюстрации стрелкой ссылка ведёт на статью на сайте CrunchGear.

В настоящее время проводится проверка целесообразности такого шага. Вместе с тем, напомним, большинство крупных поисковиков не ставят ссылки на другие ресурсы на главных страницах, только если речь не идёт о рекламе.
via TechCrunch

В настоящее время проводится проверка целесообразности такого шага. Вместе с тем, напомним, большинство крупных поисковиков не ставят ссылки на другие ресурсы на главных страницах, только если речь не идёт о рекламе.
via TechCrunch
Персональные блоги → Яндекс vs Google
А вы обратили внимание, что Google лучше ищет?
Серьезно, когда требуется найти что-то, у Google на порядок лучше результаты выдачи.
Искал сервисный центр Мазда-СТО.
Яндекс выдает ссылки на каталоги.
Google - тоже. Но на 1-ом месте у него официальный сайт центра.
И так постоянно.
Похоже, Яндекс слишком увлекся "пробками", "картами" и "фотками".
Скоро Гугл отхватит ещё пару процентов рынка поисковых систем России.
Примеры тут: http://podrabinek.com/2007/05/23/google-…
Серьезно, когда требуется найти что-то, у Google на порядок лучше результаты выдачи.
Искал сервисный центр Мазда-СТО.
Яндекс выдает ссылки на каталоги.
Google - тоже. Но на 1-ом месте у него официальный сайт центра.
И так постоянно.
Похоже, Яндекс слишком увлекся "пробками", "картами" и "фотками".
Скоро Гугл отхватит ещё пару процентов рынка поисковых систем России.
Примеры тут: http://podrabinek.com/2007/05/23/google-…
Поисковая оптимизация → Факторы, влияющие на релевантность блога в Google Blogsearch
В отличие от многих поисковиков по блогам, поисковик Google по умолчанию выводит результаты в зависимости от релевантности. Опубликованный патент даёт ответ на вопрос, в зависимости от чего ранжируются блоги в результатах поиска.
Позитивным для блога являются:
Негативно влияют следующие факторы:
Позитивным для блога являются:
- ссылки на блог в других блогроллах;
- ссылки на блог с других сайтов, которые не являются блогами;
- использование тегов для категоризации контента;
- PageRank;
- количество подписчиков на RSS блога;
- кол-во переходов со страниц результатов поиска и т.д.
Негативно влияют следующие факторы:
- публикация постов через короткие промежутки времени с чётким интервалом;
- контент блога отличается от содержания RSS;
- повышенное содержание ключевых слов, которые считаются «спамерскими»;
- большое количество дублирующегося контента;
- одинаковый или почти одинаковый размер постов;
- ссылки на один и тот же сайт во многих постах;
- большое количество рекламных блоков, баннеров и их расположение и т.д.
