Comments 31
UFO just landed and posted this here
Главный вопрос распознование картинки где происходит, на сервере или на локальном компьютере?
+2
На сервере.
Когда вы выбрали блок текста и клинкули “Copy Text” (Ctrl+C), он посылается на сервер с Ocrad OCR — движком с открытым кодом для распознавания текста. Ocrad попытается распознать кусок растровой картинки в текст, что может занять пару секунд, и после завершения вернет распознанный текст, который можно будет вставить обычным образом куда угодно (Ctrl+V).
+4
Если бы вы касались темы расширений таких вопросов бы не задавали. На клиенте хрома это сделать невозможно, точнее возможно, но через поганые приложения — читай извращения, которые как 5 колесо в разработке расширений, на лисе попроще. Бесит, не могу.
-3
Вот, распознавание цифр на клиенте: myselph.de/neuralNet.html
Могли бы и пояснить, почему невозможно: ограничение CORS.
Могли бы и пояснить, почему невозможно: ограничение CORS.
0
да, следует пояснить. Вот есть к примеру kdzwinel.github.io/JS-OCR-demo
Вот что, на js медленно работает? Ну не сказал бы. Правда точность слабовата. Но в общем есть потенциал распознавать на клиенте.
Я про то, что хром, чтобы получить доступ к чему нибудь кроме урлов в сети и пары кнопок в интерфейсе браузера, нативному коду или службе на компе пользователя требует писать так называемые приложения. Что выглядит каким то убогим корявым непонятной пользователю вещью. С FF немного легче благодаря c-types однако чтобы лис не вис (т.к один поток работы интерфейса и кода расширения ) без Palant'а автора AdBlockPlus на StackOverflow не обойтись. то есть все это первопроходчество какое то. :-)
Вот что, на js медленно работает? Ну не сказал бы. Правда точность слабовата. Но в общем есть потенциал распознавать на клиенте.
Я про то, что хром, чтобы получить доступ к чему нибудь кроме урлов в сети и пары кнопок в интерфейсе браузера, нативному коду или службе на компе пользователя требует писать так называемые приложения. Что выглядит каким то убогим корявым непонятной пользователю вещью. С FF немного легче благодаря c-types однако чтобы лис не вис (т.к один поток работы интерфейса и кода расширения ) без Palant'а автора AdBlockPlus на StackOverflow не обойтись. то есть все это первопроходчество какое то. :-)
+2
CORS кстати, не причем, на расширения он не распространяется. А вот Stroke Width Transform (SWT) на js боюсь напряжно выйдет, понятия не имею как он работает правда. С handwriting куда проще, там же тупняк сразу бинаризованный идеальный образец.
Вобщем на js переписать все, мне кажется кровь из глаз у разработчиков пойдет. А нативные либы заливать — гемор с расширениями и кроссплатформенностью. нужно же 3 платформы поддерживать минимум. Винда линух макось. Сейчас КУДА проще.
Вобщем на js переписать все, мне кажется кровь из глаз у разработчиков пойдет. А нативные либы заливать — гемор с расширениями и кроссплатформенностью. нужно же 3 платформы поддерживать минимум. Винда линух макось. Сейчас КУДА проще.
+1
CORS кстати, не причем, на расширения он не распространяется.Да, вы правы, нашел на stackoverflow
0
Если с CORS проблем в расширении нет, то не понятно, почему
На клиенте хрома это сделать невозможно
0
Жаль, что с русским текстом не работает.
-2
На hh/gt не нашел ни единого упоминания о этом замечательном расширении для Google Chrome.
А я нашёл — Расширение к браузеру для извлечения текста из изображений )
Но согласен, расширение интересное.
0
My bad, искал по полному названию — habrahabr.ru/search/?q=Project+Naptha и как-то не подумал проверить по половине.
0
Та ничего, думаю, многие могли не видеть тот пост, а приложение действительно удобное)
0
Еще можно в гугле искать: site:habrahabr.ru OR site:geektimes.ru Project Naptha
0
Жалко для Firefox нет, обещали прислать письмо, давно жду.
Удобнее было бы конечно если бы распознавал на локальном компьютере
Удобнее было бы конечно если бы распознавал на локальном компьютере
0
а чем удобнее?) пинги?
0
Пинги, траффик, нагрузка на сервер. Блокировки.
0
а расширение под 200 метров, сложности с обновлением, подарок от RAM в пол гига, вероятные висы — не? :-)
+1
Полгига рамы в случае современных браузеров это в пределах погрешности ;)
А вообще может вы и правы, возможно и правда такое дополнение слишком тяжелым было. Моё мнение похоже несколько предвзято, потому что долго приходилось пользоваться достаточно мощным компьютером с медленным и нестабильным интернетом, поэтому тяну всё в офлайн…
А вообще может вы и правы, возможно и правда такое дополнение слишком тяжелым было. Моё мнение похоже несколько предвзято, потому что долго приходилось пользоваться достаточно мощным компьютером с медленным и нестабильным интернетом, поэтому тяну всё в офлайн…
+3
Гугловцы вроде сделали чтобы на телефоне распознавашка работала
0
Если ещё актуально, Chrome-версия Naptha работает в Firefox, благодаря тому, что Firefox во многом совместим по API дополнений с Chrome.
Достаточно скачать .crx, завести учётную запись разработчика на AMO и там подписать это дополнение, выбрав «я самостоятельно буду распространять, не публикуйте на AMO».
Кроме того, есть нативный аналог — Copyfish.
Достаточно скачать .crx, завести учётную запись разработчика на AMO и там подписать это дополнение, выбрав «я самостоятельно буду распространять, не публикуйте на AMO».
Кроме того, есть нативный аналог — Copyfish.
0
Очень круто, спасибо! Осталось дождаться расширения, добавляющего улыбки на лица на картинках или следящие со всех картинок за мышкой глаза. Думаю, как то можно отделение текста применить для сжатия изображений, а там недалеко и до deep learning video compression(например, что-то такое) и до deep learning interactive video compression(своеобразный аналог программы deep.exe из вселенной Лабиринта отражений, только с обработкой на компьютере, а не на мозгах пользователей).
+1
Вроде же у яндекса перевод текста с наведением камеры есть?
0
Не все так удачно, или я что то делаю не так?
0
Хм, под линуксом и хромиумом что то не ставится:
«UTILITY_PROCESS_CRASHED_WHILE_TRYING_TO_INSTALL»
«UTILITY_PROCESS_CRASHED_WHILE_TRYING_TO_INSTALL»
0
У меня тоже линукс, установилось без проблем. Какая версия хромиума? С наскоку вот что нагуглил askubuntu.com/a/582710/389908
0
Sign up to leave a comment.
Project Naptha — выделяй, копируй и переводи тексты с любых картинок