войти зарегистрироваться

Яндекс

Яндекс
хабраиндекс
802,17

Новый Яндекс.Сервер — поранжируем?

Сегодня вышел новый Яндекс.Сервер — продукт для организации поиска по сайту или в корпоративной сети, использующий технологии большого поиска Яндекса.
В новой версии особое внимание мы уделили качеству поиска, добавив новые возможности по управлению ранжированием.

Теперь можно перемещать найденные документы на первую или последнюю позицию выдачи, указав запросы и ссылку на документ, который необходимо сделать первым или последним. Зачем это нужно? Корпоративные сайты, к примеру, могут по запросу имени сотрудника поставить на первое место страницу с его биографией. А интернет-магазины могут по запросу с упоминанием товара в качестве первой страницы указать карточку этого товара.

В новой версии Яндекс.Сервера реализовано ссылочное ранжирование, которое учитывает ссылки на документ при расчете его релевантности. Кроме того, расширился список поддерживаемых документов: MS Office 2007, Open Office и PDF-файлы версии 1.7.

Скачайте Яндекс.Сервер, находите больше и точнее.

Мария Липатова и команда Яндекс.Сервера

комментарии (44)

  • Сбылась мечта сеошников – теперь каждый сможет управлять позициями страницы )
  • А matrix net используется в этой версии яндекс.сервера?
  • Какая лицензия? Сходу не понял.
  • Отдельное спасибо за поддержку MS Office 2007, Open Office.
  • Кодировку с mysql так и не пофиксили ;(
    • Пофиксим.
      Присылайте пример конфига и описание на software@yandex-team.ru
      • а URL в MySQL из поля можно сделать? Чтобы без mysqlds? Раньше помнится нельзя было
  • А market туда входит, или там только поисковый движок?
    • Я.Сервер — отдельный продукт, поэтому его можно использовать и в корпоративных сетях со всевозможными политиками безопасности.
      Внутри продукта никакой связи с сервисами Яндекса нет.
      Но на уровне фронт-энд-а можно осуществлять любые связи.
      • Спасибо! Но я имел в виду не связь с конкретным сервисом, а движок.

        Попробую переформулировать вопрос: можно ли с помощью продукта Я.Сервер развернуть свой, узкоспециальный аналог Я.Маркета? Присутствует ли в движке каталогизатор и сравнение неких объектов по ряду параметров?
        • В Я.Сервер-е только поисковый движек.
          Поиск в Маркете, кстати, сделан на его основе.

          А Каталогизатор Маркета — это результат долгой работы отдельной команды, который в продукт не входит. Да и деление на группы товаров ведь постоянно меняется.
          • Понятно, спасибо!

            Насчет каталогизатора — я думал, для деления на группы товаров есть специальный интерфейс, который один раз сделали, и теперь используют для настройки отдельных групп. Неужели все эти формы сравнения товаров каждый раз кодируют вручную?
            • Конечно же не вручную, но глазами на них точно смотрят.
              Ну а детальней не знаю, поскольку занимаюсь не Яндекс.Маркетом.
  • Ну да, шас…
    Давайте запустите Яндекс в свои корпоративные коммерческие тайны :-))))
    • Лучше гугл, да? -)
  • Эх… А сайт Президента России нарушает условия распространения
    Это какая то лицензия особенная?
  • «Приложению не удалось запуститься, поскольку perl510.dll не был найден… »
    А что теперь perl нужен?
  • Давно руки не дохоили это самому сделать у нас, теперь надо просто обновиться)

    Летом ставил относительно новую версию — фиче-баг с несколькими DisallowIndex в одной webds похоже так и остался, приходится писать десятиэтажные регулярные выражения, чтобы исключить из индексирования страницы с нескольких сайтов (а их очень много у нас на search.sfu-kras.ru). Внутри IndexedArea они тоже у меня не заработали.

    Порадовало, что pdf-ки теперь индексируются, а то я начал было уже писать собственный поиск на java/lucene. Надеюсь doc-и тоже индексируются, не проверял.
    • И doc-и индексируются.
      Свой поиск писать не стоит, просто присылайте пожелания сюда: software@yandex-team.ru
      • Давненько писал на какой-то адрес, интересовался про платную корпоративную версию с поддержкой pdf/doc. Помню, что на вопрос есть ли такая версия мне ответили очень ёмко и лаконично — «да» ;]
  • Подсунул рабочий конфиг:
    yandex error: 21
    Initialization of Yandex.Server failed.
    • конфиг, в плане общения с документами, немного изменился
  • Не запускается как служба Windows, пишет «yandex error: 1063; StartServiceCtrlDispatcher failed..». А как консольное приложение стартует…
    • Какая битность машины? Под каким пользователем запущен севис? Какой конфиг?
  • почините, пожалуйста, ссылку на версию для Linux 2.6 (i686) в deb-пакете
    • Все работает. Качайте!
      • не устаналивается соединение с download.yandex.ru
      • спасибо, скачал, пытаюсь запустить, возникает такая проблема: индексация судя по логам идет, но в веб-интерфейсе пишет, что в индексе 0 документов
        вот выдержка из лога:

        Indexing was finished at Wed Sep 8 18:25:37 2010
        It has been indexed 28176 documents.
        Index contains 28176 documents.
        Error: tarcio.cpp:29: archive "/var/local/yandex/newindex/tmparc" is not sorted: record 28194 is duplicated

        что делать?

        p.s. я индексировал локальный трекер.

        [gidra:~] % ll /var/local/yandex/newindex [18:47]
        total 768
        -rw-r--r-- 1 root root 8192 2010-09-08 18:25 indexftds
        -rw-r--r-- 1 root root 643 2010-09-08 17:57 indexwebds
        -rw-r--r-- 1 root root 118039 2010-09-08 18:25 tmp0arc
        -rw-r--r-- 1 root root 15 2010-09-08 18:25 tmp0atr
        -rw-r--r-- 1 root root 31 2010-09-08 18:25 tmp0pls
        -rw-r--r-- 1 root root 236070 2010-09-08 18:25 tmparc
        -rw-r--r-- 1 root root 225560 2010-09-08 18:25 tmpdir
        -rw-r--r-- 1 root root 113069 2010-09-08 18:25 tmpinv
        -rw-r--r-- 1 root root 44930 2010-09-08 18:25 tmpkey
        -rw-r--r-- 1 root root 4 2010-09-08 18:25 tmpp
        -rw-r--r-- 1 root root 0 2010-09-08 18:25 tmprmurlpls
        [gidra:~] % ll /var/local/yandex/workindex [18:47]
        total 32
        -rw-r--r-- 1 root root 8 2010-09-08 17:57 indexarc
        -rw-r--r-- 1 root root 4 2010-09-08 17:57 indexdat
        -rw-r--r-- 1 root root 0 2010-09-08 17:57 indexdir
        -rw-r--r-- 1 root root 2 2010-09-08 17:57 indexfrq
        -rw-r--r-- 1 root root 4096 2010-09-08 17:57 indexftds
        -rw-r--r-- 1 root root 56 2010-09-08 17:57 indexinv
        -rw-r--r-- 1 root root 0 2010-09-08 17:57 indexkey
        -rw-r--r-- 1 root root 9 2010-09-08 17:57 indexlen
        -rw-r--r-- 1 root root 1072 2010-09-08 17:57 indextf
        -rw-r--r-- 1 root root 643 2010-09-08 17:49 indexwebds
        [gidra:~] %
        • Присылайте информацию на software@yandex-team.ru
  • все ссылки битые, на все дистрибутивы выдает 404.
    • Все бросились скачивать и мы не рассчитали нагрузку.
      Сейчас все в порядке.
  • надеюсь использование perl5.10 оправдано т.к. для CentOS (кто-то будет спорить, что это популярнейшая ОС для серверного хозяйства?) такой версии нет… Придется собирать руками, что отпадет в процессе этого из ныне работающих скриптов большой вопрос… :(
  • Наконец поставил это чудо, не работает options set name=value внутри IndexedArea, хотя работает в DefaultAreaOptions.

    Опытным путём остановлено, что не работает несколько опций DisallowIndex в одной секции (приходится писать длинные регулярки).

    Ручное ранжирование (подъём вверх, опускание вниз) требует переиндексации, неудобно, если переиндексация занимает много времени и выполняется редко.

    PDF-ки, DOC-и ищутся, это хорошо, но без options set не знаю что и делать.
Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.