Pull to refresh
7
0
Евгений @SternMore

User

Send message
Поправили как могли — вступление убрали под спойлер. Надеемся будет как-то проще. Спасибо за комментарий!
Пока в «творческом поиске» — смотрим как лучше и нагляднее. Сейчас делаются скриншоты со всех сайтов кроме тех, которые содержат видео-контент (читай youtube). В ближайшее время готовимся выкатить новый парсер, там будет, если есть картинка, заданная через Open Graph протокол (то, что берут соц.сети), то будет использоваться она, если нет, то будем делать скриншот.
Спасибо за feedback. Хоть более-менее стало понятно, что не так, а то «по тихому» минусуют и уходят пока не поймали :-D
Вообще-то наша идея и была именно такой: лето, пятница, мы попробовали сделать
что-то ненапряжно-философское, так или иначе связанное с темой IT в качестве занимательного чтива.
Какая-то наша внутри-командная философия, знаете, что-то из области «как мы видим мир вокруг и что нами движет».
Нам статья понравилась — взахлеб читали :-)
Не знаю, что на это сказать. Как-то вам не повезло. Мы сравнили оба сервиса — для нас GrabDuck возвращает более релевантные результаты.
Мы на GrabDuck концентрируем свои усилия на поиске. Давайте еще один раз пройдемся по тому, чем должен обладать хороший поиск и что уже сделано у нас или планируется в ближайшее время.

1. Поиск должен возвращать не много результатов, а релевантные результаты. Поищите в поисковике по «spring security -tutorial», получите более 100 миллионов ответов. Будет кто-то проверять их все? Нет. Обычно дальше второй — третьей страницы редко кто заглядывает. Поэтому проблема — не найти все, проблема, это показать то что нужно. На GD мы старались найти грань между «много» и «вменяемые результаты». Получилось? Узнаем, когда соберем feedback от пользователей через какое-то время. Будут нарекания — расширим поиск в сторону «много», алгоритмы от этого не меняются, только параметры.

2. Учет языка. Должно быть возможно искать, принимая во внимание синтаксис языка. Например, под запрос «красный стол» также дополнительно попадают все красные и красненькие столики и столешницы. Мы сейчас поддерживаем русский и английский. На очереди немецкий. Это не означает, что на французском искать нельзя, это означает только, что для французского поиск будет не такой гибкий. Большинство систем, в таком ключе, поддерживают только один язык — «американский».

3. Должен выполняться поиск по всей фразе, а не по словам поискового запроса. Приведу пример с тем же красным столом. Если я ищу красный стол, то хочу видеть информацию именно про красный стол, а не про зеленый, который мне будет выдан только потому, что в документе дополнительно присутствует информация о красном одеяле. Опять, говоря про большинство систем, не специализирующихся на поиске, результат — это документы, где просто присутствуют все или хотя бы одно из слов запроса. Поверьте нам на слово, мы проводили анализ нескольких систем из доступных в opensourse, там именно так.

4. Система должна поправлять очепятки, а не искать бездумно что попросили. Особо говорить здесь не о чем. Понятно и так, кажется, что система должна это делать так или иначе. Самый известный пример, это Google с его «Did you mean?» функциональностью.

5. Система должна учитывать при поиске синонимы. Уже проходил этот пример в комментариях — если я ищу «javascript», я буду очень удивлен если документы только с «js» не будут мне показаны. Это происходит потому, что для меня javascript и js две взаимозаменяемые сущности. Но это не так с т.з. компьютерной системы. Чтобы быть в состоянии это делать, сервис должен быть либо большим, таким как google, тогда в компании просто есть ресурсы для того, чтобы качественно прорабатывать «все все, про все про все» или покрывать только небольшое количество доменных областей, о которых у команды есть знания. Построить здесь универсальный алгоритм, обрабатывающий «все и без усилия» невозможно.

6. Было бы очень хорошо, если бы сервис сам мог классифицировать документы (проставлять теги, категории, помещать документ в нужную папочку). Прежде всего, есть какая-то общая классификация, например, если статья о javascript, то наверняка тег с таким же название подойдет. Как понять то, что статья именно о javascript, это другой большой вопрос. Кроме того, как дополнение, всегда можно посмотреть: «а что же там пользователь сам набивает для подобного материала», — и добавить классификацию в новые документы автоматически. Сейчас из того, что я знаю, это делает только google и evernote. Скоро будем и мы. :-)

Все из вышеперечисленного возможно на diigo? Я в этом как-то очень сомневаюсь. И не потому что они плохие, просто, это не их конек.

Про борьбу с корпоративной информацией.
Не видим проблемы с показом чужой корпоративной информации и паролей. Все рекомендации, это публичный контент доступный каждому по публичному url. Парсинг осуществляется не на клиенте, а на сервере у которого нет и быть не может доступа к чему-то секретному или корпоративному.

С Adult контентом готовы и будем бороться. Даже знаем, как это делается — в рекомендациях показывать не будем.

Надеюсь, что ответил вам на все ваши вопросы и считаю дискуссию по данному вопросу с нашей стороны закрытой.
Спасибо за ваше мнение.
По имени домена действительно не ищет. Изначально думали нужно нам это или нет. Остановились на том, что вроде самим не надо и решили «огородов не городить». Наверное все таки реализуем, но как фильтр.

Прямой функции «поменять пароль» сейчас действительно нет. Пока можно пользоваться функцией «Забыл пароль», она позволяет сменить теккущий пароль, если есть доступ к email.

Мы видим это наоборот — когда ищу что-то свое, всегда интересно посмотреть, что еще у кого-то есть на данную тему. Тем более, что если ничего путнего нет, то смотреть вроде как никто не заставляет. Как вариант, который понравиться всем, можем рассмотреть пользовательскую настройку — по умолчанию искать или нет по другим закладкам.

Кстати, если пользуетесь Trello, то посмотрите здесь — мы стараемся аккумулировать весь «feedback» от пользователей.
Спасибо за комментарий и за то что посмотрели наш материал.
Мы понимаем, что GrabDuck не панацея от всех бед, которая поможет каждому. Кому-то сервис подойдет, кому-то нет.
Давайте еще раз. Я не вижу как мы похожи на Diigo, поэтому мне трудно сравнить его с GrabDuck. Из того, что я вижу навскидку, что есть на сервисе и что является его основной чертой — это обмен какой-то полезной инфой между пользователями. Наша концепция это быстро помочь пользователю найти решение его вопроса и порекомендовать какие-то другие материалы. У нас нет и не планируется отмечать что-то для других пользователей. Мы не планируем делать какие-то персонализированные (социальные) рекомендации по типу “Вася считает это вам поможет”. Diigo наверное хороший и удобный сервис, но к сожалению больше ничего о нем сказать не могу.

По импорту, Михаил, что именно не получилось. Можно подробней? У других пользователей все работает нормально. Где произошел затык? На сервер получилось сохранить?
Про Diigo я написал развернутый ответ выше в комментариях. Смысл делать еще один такой же Diigo, но заведомо хуже, не видим.

У Grabduck другой путь и тот финальный продукт, который держим в голове, абсолютно не похож на сегодняшний Diigo.com, также как и на Delicious.

По ценовой политике — уже тоже говорили. Если кратко, будет абонентка, т.к. приток средств за работу мотивирует больше всего. Сколько — будем исходить из того, что есть/принято на рынке.
Да, уже вчера поняли это. Спасибо, поправим.
GrabDuck — сервис хранения закладок, где во главу угла поставлено: найди мне нужную ссылку/статью, даже если я помню о ней достаточно приблизительно или не помню вообще.

Delicious это social bookmarking. Где основное — это смотреть что в тренде по каким-то интересующим меня областям и набивать свою коллекцию ссылок. Еще по-моему Delicious не позволяет искать по самим документам.
Извините, но мы этого не видим. Мы знаем про этот проект — ничего общего.
Он больше конкурент стандартному поиску от Google — альтернативный универсальный поисковик, как и DDG — для любителей уйти от всезнающего и наблюдающего за всем Google.
Ребята молодцы, придумали интересное решение. Из минусов я бы назвал необходимость разворачивать свою локальную ноду — далеко не каждый будет это делать. Ну и с релевантностью поиска самого не до конца понятно.
А чем он похож? Конкурент Instapaper, это getpocket или на худой конец evernote. Это все сервисы отложенного чтения. Мы не показываем контент, а только выполняем поиск и рекомендуем то, что нашли другие пользователи по этому запросу.

Так вам для iOS или Android? ;-)

Про ценовую политику. Ждали этот вопрос :-)
Пока для нас несколько преждевременно. Монетизация будет — хотим чтобы сервис развивался и совершенствовался — поступление средств для этого самый лучший мотиватор. Будет абонентка. Какая именно, сейчас сложно сказать — будем равняться на то, что работает на рынке для подобных сервисов. Предложим на выбор несколько тарифных планов.
Думаю, что нет. Diigo — это social bookmarking, как и Delicious. Их специализация на социальности, подписках на что-то, фоловерах и прочем. Мы делаем копилку личного материала, который собирается для себя. Рекомендации, которые мы даем, они сугубо по тому запросу, который пользователь ищет и могут быть именно сейчас ему полезны для решения какой-то конкретной проблемы.

Grabduck не поддерживает функцию: «Дай-ка почитаю, что там запостили сегодня по тегу javascript”, как Delicious.
Ваша мысль опережает наши действия :-D
У нас планах стоит синхронизация с избранным хабра и SO
Ага, такой большой, что провайдер целиком завалился .
Приносим свои извинения, говорят скоро должны починить. Провайдер contabo.de если кому интересно.
У нас другая концепция и доменная область. По тем документам, которые сейчас в системе, уже можно сказать, что у нас большой крен в ИТ. Это означает, что нам придется разбираться с тонкостями именно этого мира, чтобы показать качественные рекомендации. Как небольшой пример: необходимо понимать, какие синонимы мы можем использовать при выполнении поискового запроса. Например, если пользователь ищет что-то по javascript, то все что удовлетворяет слову js, тоже подходит. Или для показа рекомендаций необходимо возвращать не только документы, которые удовлетворяют запросу, но ограничивать их только теми технологиями, которые интересны пользователю. Тема обширна и одного комментария для того, чтобы дать полный ответ, тут недостаточно. Мы планировали освещать какие-то такие детали в следующих статьях. А так, да — все на что-то так или иначе похоже.
Потому что, может сложиться ситуация, когда данный сервис (FB,VK,G+) не работает и вы не сможете воспользоваться им для захода на GD. В этом случае у вас всегда есть email / пароль, которые вы завели.


Да, мы поняли, что плагин нужен скорее. Правда, посмотрим когда сможем сделать.
Здорово, мотивирует! Будут комментарии — обязательно пишите.
Конечно будет — в планах сделать для firefox, opera и safari. Сейчас мы на стадии MVP, руки пока просто не дошли.
1

Information

Rating
Does not participate
Registered
Activity