войти зарегистрироваться

Блог компании ABBYYABBYY FineFoto: фан из фотоаппарата

Как знают постоянные читатели нашего блога, мы любим проводить разные соревнования и конкурсы. Многие разработчики принимали участие в ABBYY Cup, переводчики – в Кубке Lingvo, ещё у нас есть фотоконкурс ABBYY FineFoto.

В FineFoto обычно участвуют любители поиграться с фотошопом и люди, у которых есть фотографии смешных надписей (вывесок, объявлений и т.п.) на русском языке или необычных – на иностранных языках (как нам кажется, такие фотографии есть практически у всех). Под кат мы сложили удачные картинки, которые нам присылают участники. Have fun :-)

Блог компании ABBYYЭкспорт в ODT и распознавание старинных текстов теперь в онлайне

imageВсем привет от команды разработчиков FineReader Online.
Когда в этом блоге писали про то, что ABBYY FineReader 11 стал ближе к пользователям линукса, потому что он умеет экспортировать в ODT, нас немножко обсмеяли в комментах. Да, наверное, вы были правы. Мы поняли свою ошибку и исправились — теперь получить из картинки качественно распознанный файл в формате ODT можно не перебираясь из Linux'а даже под виртуальную машину с виндой. Среди форматов экспорта FineReader Online есть так любимый многими пользователями свободного ПО Open Document Text.

WindowsТестирование ABBYY FineReader 11

Недавно вышла 11-я версия известного в России и в мире программного продукта по оптическому распознаванию текста ABBYY FineReader. В этой версии анонсировано множество улучшений, а основной упор делается на увеличение производительности и снижение ошибок. Эти улучшения — в сравнении с 10-й версией. Я же не пользовался этой программой со студенческих лет (с начала 2000-х), и наверняка пропустил версий, эдак, шесть. В те годы интернет и мобильные технологии не были развиты так сильно, а времени было много. Поэтому я был готов брать в библиотеке книгу на час, снимать копии, ехать в один конец города к компьютеру, где есть сканер, затем в другой конец, туда, где есть FineReader, а затем домой, доисправлять ошибки распознавания и форматирования в Word-овских файлах. Сегодня же юзер стал ленивее и требовательнее, поэтому хочу рассмотреть работу с программой в ракурсе современных доступных технологий и острой нехватки времени.

Блог компании ABBYYЧто нового в ABBYY FineReader 11?

Сегодня выходит ABBYY FineReader 11, и сейчас мы расскажем вам, чем он отличается от десятой версии. Прежде всего, достаточно заметно донастроились алгоритмы поиска на странице текста, картинок и таблиц – то, что у нас называют «Анализ документа», а в мире понятным словом zoning. Главное, к чему мы стремились, работая над новой версией, – улучшить «понимание» документов, с которыми пользователи сталкиваются каждый день: книг, договоров, журналов. Одним из легко заметных изменений стало то, что FineReader 11 научился находить вертикальные колонтитулы.
image

ПодкастыРунетология (107): основатель компании ABBYY Давид Ян

Давид Ян — о том, как создавался словарь ABBYY Lingvo, как пираты, сами того не понимая, продвигали продажи компании, о первом в мире коммуникаторе Cybiko, о том, как увлечение ресторанным делом снова привело его в IT, о миссии предпринимателя и неочевидных секретах успеха в бизнесе.
прослушан 966 раз

Блог компании ABBYYЧто общего у монахов, оптического распознавания текстов и козьего сыра?

Если вы ответите «ABBYY FineReader», то будете правы. Некоторое время назад в американский офис ABBYY обратился отец Григорий, настоятель монастыря Святого Григория Паламы (St. Gregory Palamas Monastery), с просьбой помочь решить необычную задачу, которая стояла перед монастырём. В монастыре хранится архив старых документов на греческом языке с политонической системой диактрики, которые нужно было оцифровать. Узнав об этом, наши американские коллеги подарили настоятелю коробку ABBYY FineReader 10 Professional Edition. Что это за система и почему отцу Григорию понадобился именно FineReader – читайте под катом.

Блог компании ABBYYКак технология MRC уменьшает размер PDF-документов

Формат PDF уже давно прижился как средство сохранения документов, которые затем не предполагается редактировать. Все PDF файлы можно условно разделить на два класса. Первый – это документы, которые были свёрстаны в цифровом виде, и затем были сконвертированы в PDF. Инструкция к какому-нибудь устройству будет, скорее всего, именно таким файлом. Внутри он выглядит как текст и графика плюс команды форматирования, описывающие, как надо располагать элементы на странице.

Второй класс – это документы, полученные в результате сканирования бумажных изображений. Их можно пропустить через ABBYY FineReader, и они превратятся в первый тип, а можно просто сохранить в PDF как картинки. И этим часто имеет смысл пользоваться, когда хочется сохранить исходный вид документа. Несмотря на то, что ABBYY FineReader довольно хорошо распознаёт документы, возникают ошибки распознавания, какие-то важные элементы на странице не находятся, в общем, то, что получается, по виду несколько отличается от исходного документа.

Поэтому часто имеет смысл сохранять в PDF изображение исходной картинки, а под него подкладывать распознанный текст для того, чтобы можно было найти документ по ключевым словам или воспользоваться copy-paste. Смущает только один момент – такие PDF-файлы имеют немаленький размер, от полумегабайта на страницу и больше. Соответственно, если отсканировать среднего размера учебник по матанализу, получится файл мегабайт на 200.

Персональные блоги Давид Ян (ABBYY) о том, как был создан FineReader

Был недавно на встрече некого клуба, где выступал Давид Ян (основатель компании ABBYY). Часть выступления записал на телефон. Расшифровку записи представляю Вашему вниманию.

--------------------------------
Если компания выходит на рынок и на этом рынке уже есть что-то похожее, то, об этом можно прочитать во многих книжках, в частности по ведению военных стратегий. Идея основная заключается в следующем: Чтобы не сталкиваться с сильным конкурентом что называется «на его поле». То есть необходимо находить своё поле боя, там где конкурент абсолютно беззащитен и никогда не собирался даже выставлять силы.

Приведу пример: в своё время мы выходили с продуктом под названием Fine Reader. В 92 году ко мне подошел Костя Анисимович, наш technology officer, и сказал «давай сделаем нашу собственную систему распознавания». Это выглядело абсолютно как безумие, потому что

Блог компании ABBYYНеочевидные возможности ABBYY FineReader



Каждая следующая версия ABBYY FineReader становится всё более интуитивно понятной. В частности, в последние версии включена система встроенных сценариев, которые дают возможность выполнить стандартные последовательности действий за несколько щелчков мышью. Так мы стараемся облегчить работу с программой для большинства наших пользователей. И, тем не менее, FineReader обладает рядом возможностей, которые не лежат на поверхности, но могут быть полезны пользователям «продвинутым». О нескольких таких возможностях мы расскажем в этом посте.