Поисковые машины и технологии

индекс
99,35

Англоподсказка исправит ломаный английский

17% запросов Нигмы.ру – это англоязычные запросы. Пользователи не хотят ограничиваться рунетом, им нужен поиск по всему Интернету. Но при этом очевидно, что среди русскоязычных пользователей процент знающих английский в совершенстве – не так высок, поэтому мы запустили лингвистический анализатор «Англоподсказка», который позволяет исправлять ломаный английский в запросах на более формальный.

Такой сервис особенно нужен именно в поиске. Например, один из разработчиков Англоподсказки рассказывал, что еще до работы в Нигме долго и безуспешно гуглил по фразе “worm spread”, изучая методы распространения Интернет-червей. Англоподсказка Nigma.ru теперь предлагает правильное исправление этого запроса: «worm propagation»

image

Для работы этого сервиса была построена семантическая сеть английских слов, связанных друг с другом через перевод с русского на английский и обратно. В результате, лингвистический анализатор перебирает все возможные схожие (с точки зрения русскоязычного пользователя) английские понятия (которые для англоязычного пользователя могут и не быть синонимами), и выбирает те, частотность которых в литературных и вообще формальных текстах – выше. Если в формальных текстах не удалось найти достаточного количества примером употребления, поиск ведется по всем документам. Кстати, т.к. поиск в первую очередь ведется по формальным документам, часто запрос исправляется так, чтобы в выдаче было меньше коммерческой информации.
+54
16 июля 2009, 15:14
2

комментарии (36)

+3
sHinE #
Полезно. Можно как подсказку не только при поиске использовать, а и при написании английских текстов.
+3
kulikoff #
Мне это видится довольно полезным. Особенно если качество поисковой выдачи от этого вырастет.
0
rglab #
Wow, that's a good idea. I like it
0
avenu #
А исправление ошибок написания английского вы сделали нормальным? Иногда такие перлы попадаются. Да что иногда, почти всегда.
–1
DileSoft #
жаль перевод нет. я ввел запрос «зависание» и хотел бы чтобы мне сказали, что по английски это будет «hang».
–2
DileSoft #
www.fastgoogle.ru/?bar=1#%D0%B7%D0%B0%D0%B2%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5 — мой поисковик это умеет. :)
+1
web4_0 #
Ну, и дань традиции: Семенович по-английски пишут?
+5
nooze #
Надо спасать положение!
–13
rentage #
нигма все больше и больше говна добавляет,
а хостов как нет так и не прибавляет

ой, стишок получился
0
Slasyz #
Толсто и не остроумно.
+1
oYASo #
Нигма идет правильной дорогой!
0
apok #
Радуют постоянные обновления Нигмы и вводимые фишки.
Но, всё же насущный вопрос… Планируете что-нибудь с адресами страниц делать?
+2
victor_lavrenko #
да, планируем. и как всегда это будет очень нестандартный ход. но, наверное, не в этом месяце. просто у нас тут серия релизов, и мы стараемся чаще одного релиза в одну-две недели не делать.
0
inshower #
Вот до чего хорошие алгоритмы и логика в нигме, но как же не хватает дизайнера, сопоставимого по уровню программистам.
Цены бы не было!
0
trak #
А я не понял, а зачем там под поисковой строкой есть галочки с Яндексом и Гуглом-то? Причем, если их даже отключить, то результат все равно с Гугла приходит. А зачем тогда нигма нужна?
0
inshower #
там много чего непонятно зачем сделано
т.е. всё как бы ок, но дизайнер не справляется с идеями девелоперов
вон — посмотрите как дизайнерятся выдачи на wolfram alpha
+2
gupper_grans #
Каждый раз что-нибудь новое и каждый раз в точку :) Отлично :)

PS: гуглить в Нигме и нигмить в гугле :)
0
za4to #
Исправьте опечатку на главной :)
Англоподскзка от Nigma.ru
0
krisstail #
Done! спасибки :)
0
trak #
Что-то не работает подсказка ваша. Проверьте на «Phat crib». Или на «Cool ars»
:)
0
Unixspv #
«Boobs of Anna Semenovich»

Англоподсказка: Подходящих выражений не найдено

А так хотелось, что бы и в этот раз сработало :)
+2
parovozik #
Осталось чуть-чуть подождать и будет так:

Открываешь nigma.ru, смотришь на лого и бац, Нигма сама понимает, что ты хочешь найти =)
+2
nooze #
И тут же звонок в дверь — уже принесла!
+5
xappymah #
… принесла Анну Семенович!
0
utf9 #
А можно сделать так, чтобы англоподсказкой можно было пользоваться без захода на страницу результатов поиска? Т.е., результат англоподсказки должен выводиться в suggest.
+1
victor_lavrenko #
конечно можно — сейчас англоподсказка работает только на одном сервере в последовательном режиме (т.е. на одном ядре) — в результате, чуточку медленнее, чем это нужно для автозаполнения. если много пользователей сочтут англоподсказку полезной, мы купим еще серверов, подоптимизируем алгоритмы и включим ее сразу в подсказку.
+3
gopline #
Стало интересно. Буду пользоваться нигмой некоторое время :)
0
cycero #
Нигма хороша. Приятно, что разработка не останавливается как у некоторых. Всегда надо стремиться к лучшему, в противном случае другие сделают это за тебя ;)
0
trak #
Не ради холивара, но скажите мне, чем хороша Нигма? Мне она вообще ничем не приглянулась. Какой-то сайтик, типа помните был пунто-свитчер, так там был тоже агреггатор из поисковиков.
0
cycero #
Ответ прост — нравится оригинальностью. Поисковая система не такая как все… У них тоже есть над чем поработать, но в целом меня устраивает как она работает.
0
paranome #
А я хотел посмотреть, как правильно ищут ЦП носители Языка. А в нигме как выскочит, как выпрыгнет!

P.S. Оригинальный запрос — в GET-переменной s.
P.P.S. Я бы из выдачи по этому запросу убрал рекламу от Яндекс.Директ («Из УК РФ исключат более полутора десятков преступлений. Подробности на...») — выглядит как пропаганда.
P.P.P.S. Спасибо, полезно.
+1
object #
по нигме плачут, наверное, все дизайнеры хабра. Так руки и чешутся заменить все знаки дюйма на кавычки, все тире на дефисы и убрать подчеркивание с нессылок
0
inshower #
и ещё примерно 500 пунктов по списку
0
shortcaster #
Сколько интересно в этой поисковой системе все-таки. Кстати ИЩЕТ она хорошо?
0
proxor #
Не хуже гугла или яндекса. Хотя бы потому, что может аггрегировать поиск оттуда.
0
victor_lavrenko #
только что меня спросили какое оригинальное название у фильма «джонни д». нигма сразу нашла ответ: www.nigma.ru/index.php?s=%D0%B4%D0%B6%D0%BE%D0%BD%D0%BD%D0%B8+%D0%B4

в данном случае, выходит, ищет просто отлично.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.