По ссылке более практичное решение (например, потому что можно использовать пальчиковые аккумуляторы), а здесь — более олдскульное :)
А вообще не понимаю, как это я пропустил указанный Вами пост?!
Не понял, причём тут Linux, но на всякий случай плюсанул :)
Вообще, люди на Windows тоже используют Oo.o. Вот я, например, использую. Предлагаю найти более подходящий блог для топика.
В Википедии по этому поводу всё правильно написано. «Название компании произносится как «аби» и буквально означает «ясный глаз»; реконструированная форма праязыка мяо-яо, гипотетического языка-предка групп мяо-яо, ну, хмун, хмонг и киммун; название связано с деятельностью компании в области создания систем оптического распознавания текстов.»
Если уж нормальные разборные смотреть — в том же Декатлоне за 649 рублей поприятнее девайс выглядит, чем аналогичный (но при этом более дорогой) в lecoshop
Пользователь Вася. Карма: 25 см.
А если серьёзно, то попытки наверняка уже были, но есть ряд проблем, не позволяющих нормально реализовать описанное. Например, как убрать всяческих извращенцев, несовершеннолетних? Ну а про ускоренный перенос всякой заразы можно даже не говорить — и так очевидно.
Речь о том, что если раньше (до 8 версии включительно) мы старались сосредоточиться на распознавании символов, то теперь идём несколько дальше — делаем всё больший и больший акцент на то, что «вот это — колонтитул, а вот это — сноска, а вот это — оглавление» и оформляем структурные элементы текста соответствующим образом в результатах экспорта (т.е. в текстовых файлах, которые пользователь получает в результате распознавания).
Кроме того, при рассмотрении целого документа можно с большей уверенностью говорить, что, например, если на 1,2 и 4 страницах есть колонтитул, то на 3 вооон та строка тоже может им быть. Т.е. пытаемся искать структурные части, характерные документу (т.е. набору страниц), а не отдельно взятой странице.
Проблема непобедима. Бывают ненумерованные списки, которые начинаются с "-". На них и ориентируемся. Подавляющему большинству пользователей так и надо.
Судя по всему, Вы останавливаете процесс, когда распознана часть страниц. Программа устроена так, что сначала распознаются сами символы и им не сопоставляются никакие стили. Соответствие «буква-стиль» выставляется в самом конце процесса, потому что документ рассматривается как единое целое. Если этот процесс не прошёл, то экспортировать программа не разрешает и это логично.
Если Вам нужно экспортировать часть страниц, Вы должны полностью распознать эти страницы и тогда сможете экспортировать их.
Если поверите, то могу как частное лицо сказать, что по моему личному впечатлению FR10 распознаёт лучше, чем FR9. Работа технологов не прекращается и это отражается на характеристиках продукта.
Кроме того, меня об этом посте даже не просили, я сам изъявил желание написать на Хабре, потому что FR — достаточно известная программа и я не сомневался, что хабраобщественность будет не против такой новости. Тем более приятно чувствовать, что принимаю участие в проекте, который полезен многим людям.
В общем, рассматривать мою позицию как позицию «фирмы-создателя» не совсем правильно, хотя связующим звеном я могу быть :)
Пока ничего, кроме SDK у нас под Linux нет.
Пользуясь случаем пропиарю веб-сервис finereaderonline.ru/, который в неклинических случаях (не слишком сложный документ и не слишком много страниц) должен Вам помочь. Кроме того, сервис будет продолжать своё развитие. Возможно, в скором времени он будет помогать и в клинических случаях. Следите за развитием событий :)