Блог компании ABBYY → ABBYY FineFoto: фан из фотоаппарата
Как знают постоянные читатели нашего блога, мы любим проводить разные соревнования и конкурсы. Многие разработчики принимали участие в ABBYY Cup, переводчики – в Кубке Lingvo, ещё у нас есть фотоконкурс ABBYY FineFoto. В FineFoto обычно участвуют любители поиграться с фотошопом и люди, у которых есть фотографии смешных надписей (вывесок, объявлений и т.п.) на русском языке или необычных – на иностранных языках (как нам кажется, такие фотографии есть практически у всех). Под кат мы сложили удачные картинки, которые нам присылают участники. Have fun :-)
Блог компании ABBYY → Экспорт в ODT и распознавание старинных текстов теперь в онлайне
Всем привет от команды разработчиков FineReader Online.Когда в этом блоге писали про то, что ABBYY FineReader 11 стал ближе к пользователям линукса, потому что он умеет экспортировать в ODT, нас немножко обсмеяли в комментах. Да, наверное, вы были правы. Мы поняли свою ошибку и исправились — теперь получить из картинки качественно распознанный файл в формате ODT можно не перебираясь из Linux'а даже под виртуальную машину с виндой. Среди форматов экспорта FineReader Online есть так любимый многими пользователями свободного ПО Open Document Text.
Windows → Тестирование ABBYY FineReader 11
Недавно вышла 11-я версия известного в России и в мире программного продукта по оптическому распознаванию текста ABBYY FineReader. В этой версии анонсировано множество улучшений, а основной упор делается на увеличение производительности и снижение ошибок. Эти улучшения — в сравнении с 10-й версией. Я же не пользовался этой программой со студенческих лет (с начала 2000-х), и наверняка пропустил версий, эдак, шесть. В те годы интернет и мобильные технологии не были развиты так сильно, а времени было много. Поэтому я был готов брать в библиотеке книгу на час, снимать копии, ехать в один конец города к компьютеру, где есть сканер, затем в другой конец, туда, где есть FineReader, а затем домой, доисправлять ошибки распознавания и форматирования в Word-овских файлах. Сегодня же юзер стал ленивее и требовательнее, поэтому хочу рассмотреть работу с программой в ракурсе современных доступных технологий и острой нехватки времени.
Блог компании ABBYY → Что нового в ABBYY FineReader 11?
Сегодня выходит ABBYY FineReader 11, и сейчас мы расскажем вам, чем он отличается от десятой версии. Прежде всего, достаточно заметно донастроились алгоритмы поиска на странице текста, картинок и таблиц – то, что у нас называют «Анализ документа», а в мире понятным словом zoning. Главное, к чему мы стремились, работая над новой версией, – улучшить «понимание» документов, с которыми пользователи сталкиваются каждый день: книг, договоров, журналов. Одним из легко заметных изменений стало то, что FineReader 11 научился находить вертикальные колонтитулы.


Подкасты → Рунетология (107): основатель компании ABBYY Давид Ян
Давид Ян — о том, как создавался словарь ABBYY Lingvo, как пираты, сами того не понимая, продвигали продажи компании, о первом в мире коммуникаторе Cybiko, о том, как увлечение ресторанным делом снова привело его в IT, о миссии предпринимателя и неочевидных секретах успеха в бизнесе.
прослушан 966 раз
Блог компании ABBYY → Что общего у монахов, оптического распознавания текстов и козьего сыра?
Если вы ответите «ABBYY FineReader», то будете правы. Некоторое время назад в американский офис ABBYY обратился отец Григорий, настоятель монастыря Святого Григория Паламы (St. Gregory Palamas Monastery), с просьбой помочь решить необычную задачу, которая стояла перед монастырём. В монастыре хранится архив старых документов на греческом языке с политонической системой диактрики, которые нужно было оцифровать. Узнав об этом, наши американские коллеги подарили настоятелю коробку ABBYY FineReader 10 Professional Edition. Что это за система и почему отцу Григорию понадобился именно FineReader – читайте под катом.
Блог компании ABBYY → Как технология MRC уменьшает размер PDF-документов
Формат PDF уже давно прижился как средство сохранения документов, которые затем не предполагается редактировать. Все PDF файлы можно условно разделить на два класса. Первый – это документы, которые были свёрстаны в цифровом виде, и затем были сконвертированы в PDF. Инструкция к какому-нибудь устройству будет, скорее всего, именно таким файлом. Внутри он выглядит как текст и графика плюс команды форматирования, описывающие, как надо располагать элементы на странице. Второй класс – это документы, полученные в результате сканирования бумажных изображений. Их можно пропустить через ABBYY FineReader, и они превратятся в первый тип, а можно просто сохранить в PDF как картинки. И этим часто имеет смысл пользоваться, когда хочется сохранить исходный вид документа. Несмотря на то, что ABBYY FineReader довольно хорошо распознаёт документы, возникают ошибки распознавания, какие-то важные элементы на странице не находятся, в общем, то, что получается, по виду несколько отличается от исходного документа.
Поэтому часто имеет смысл сохранять в PDF изображение исходной картинки, а под него подкладывать распознанный текст для того, чтобы можно было найти документ по ключевым словам или воспользоваться copy-paste. Смущает только один момент – такие PDF-файлы имеют немаленький размер, от полумегабайта на страницу и больше. Соответственно, если отсканировать среднего размера учебник по матанализу, получится файл мегабайт на 200.
Персональные блоги → Давид Ян (ABBYY) о том, как был создан FineReader
Был недавно на встрече некого клуба, где выступал Давид Ян (основатель компании ABBYY). Часть выступления записал на телефон. Расшифровку записи представляю Вашему вниманию.
Если компания выходит на рынок и на этом рынке уже есть что-то похожее, то, об этом можно прочитать во многих книжках, в частности по ведению военных стратегий. Идея основная заключается в следующем: Чтобы не сталкиваться с сильным конкурентом что называется «на его поле». То есть необходимо находить своё поле боя, там где конкурент абсолютно беззащитен и никогда не собирался даже выставлять силы.
Приведу пример: в своё время мы выходили с продуктом под названием Fine Reader. В 92 году ко мне подошел Костя Анисимович, наш technology officer, и сказал «давай сделаем нашу собственную систему распознавания». Это выглядело абсолютно как безумие, потому что
--------------------------------Если компания выходит на рынок и на этом рынке уже есть что-то похожее, то, об этом можно прочитать во многих книжках, в частности по ведению военных стратегий. Идея основная заключается в следующем: Чтобы не сталкиваться с сильным конкурентом что называется «на его поле». То есть необходимо находить своё поле боя, там где конкурент абсолютно беззащитен и никогда не собирался даже выставлять силы.
Приведу пример: в своё время мы выходили с продуктом под названием Fine Reader. В 92 году ко мне подошел Костя Анисимович, наш technology officer, и сказал «давай сделаем нашу собственную систему распознавания». Это выглядело абсолютно как безумие, потому что
Блог компании ABBYY → Неочевидные возможности ABBYY FineReader

Каждая следующая версия ABBYY FineReader становится всё более интуитивно понятной. В частности, в последние версии включена система встроенных сценариев, которые дают возможность выполнить стандартные последовательности действий за несколько щелчков мышью. Так мы стараемся облегчить работу с программой для большинства наших пользователей. И, тем не менее, FineReader обладает рядом возможностей, которые не лежат на поверхности, но могут быть полезны пользователям «продвинутым». О нескольких таких возможностях мы расскажем в этом посте.
