Pull to refresh

Comments 31

UFO just landed and posted this here
Главный вопрос распознование картинки где происходит, на сервере или на локальном компьютере?
На сервере.
Когда вы выбрали блок текста и клинкули “Copy Text” (Ctrl+C), он посылается на сервер с Ocrad OCR — движком с открытым кодом для распознавания текста. Ocrad попытается распознать кусок растровой картинки в текст, что может занять пару секунд, и после завершения вернет распознанный текст, который можно будет вставить обычным образом куда угодно (Ctrl+V).
Если бы вы касались темы расширений таких вопросов бы не задавали. На клиенте хрома это сделать невозможно, точнее возможно, но через поганые приложения — читай извращения, которые как 5 колесо в разработке расширений, на лисе попроще. Бесит, не могу.
Вот, распознавание цифр на клиенте: myselph.de/neuralNet.html
Могли бы и пояснить, почему невозможно: ограничение CORS.
да, следует пояснить. Вот есть к примеру kdzwinel.github.io/JS-OCR-demo
Вот что, на js медленно работает? Ну не сказал бы. Правда точность слабовата. Но в общем есть потенциал распознавать на клиенте.

Я про то, что хром, чтобы получить доступ к чему нибудь кроме урлов в сети и пары кнопок в интерфейсе браузера, нативному коду или службе на компе пользователя требует писать так называемые приложения. Что выглядит каким то убогим корявым непонятной пользователю вещью. С FF немного легче благодаря c-types однако чтобы лис не вис (т.к один поток работы интерфейса и кода расширения ) без Palant'а автора AdBlockPlus на StackOverflow не обойтись. то есть все это первопроходчество какое то. :-)
CORS кстати, не причем, на расширения он не распространяется. А вот Stroke Width Transform (SWT) на js боюсь напряжно выйдет, понятия не имею как он работает правда. С handwriting куда проще, там же тупняк сразу бинаризованный идеальный образец.
Вобщем на js переписать все, мне кажется кровь из глаз у разработчиков пойдет. А нативные либы заливать — гемор с расширениями и кроссплатформенностью. нужно же 3 платформы поддерживать минимум. Винда линух макось. Сейчас КУДА проще.
Если с CORS проблем в расширении нет, то не понятно, почему
На клиенте хрома это сделать невозможно
Жаль, что с русским текстом не работает.
С русским текстом прекрасно работает, только ему нужно подсказать, что это русский:

image
Та ничего, думаю, многие могли не видеть тот пост, а приложение действительно удобное)
Жалко для Firefox нет, обещали прислать письмо, давно жду.
Удобнее было бы конечно если бы распознавал на локальном компьютере
Пинги, траффик, нагрузка на сервер. Блокировки.
а расширение под 200 метров, сложности с обновлением, подарок от RAM в пол гига, вероятные висы — не? :-)
Полгига рамы в случае современных браузеров это в пределах погрешности ;)
А вообще может вы и правы, возможно и правда такое дополнение слишком тяжелым было. Моё мнение похоже несколько предвзято, потому что долго приходилось пользоваться достаточно мощным компьютером с медленным и нестабильным интернетом, поэтому тяну всё в офлайн…
Гугловцы вроде сделали чтобы на телефоне распознавашка работала
Если ещё актуально, Chrome-версия Naptha работает в Firefox, благодаря тому, что Firefox во многом совместим по API дополнений с Chrome.

Достаточно скачать .crx, завести учётную запись разработчика на AMO и там подписать это дополнение, выбрав «я самостоятельно буду распространять, не публикуйте на AMO».

Кроме того, есть нативный аналог — Copyfish.
Очень круто, спасибо! Осталось дождаться расширения, добавляющего улыбки на лица на картинках или следящие со всех картинок за мышкой глаза. Думаю, как то можно отделение текста применить для сжатия изображений, а там недалеко и до deep learning video compression(например, что-то такое) и до deep learning interactive video compression(своеобразный аналог программы deep.exe из вселенной Лабиринта отражений, только с обработкой на компьютере, а не на мозгах пользователей).
Вроде же у яндекса перевод текста с наведением камеры есть?
Не все так удачно, или я что то делаю не так?image
Вы мне мозг сломали своими рекурсивными скриншотами :)

Duke565 — установите английский язык в меню Language, очевидно что плагин пытается распознать русский.
У меня тоже нормально работает (только текст почему-то выделился в форме параллелограмма):
Хм, под линуксом и хромиумом что то не ставится:
«UTILITY_PROCESS_CRASHED_WHILE_TRYING_TO_INSTALL»
Sign up to leave a comment.

Articles