Pull to refresh

Полнотекстовые статьи из RSS для вашей читалки с использованием Calibre

Reading time2 min
Views6.5K
Тема поднималась несколько раз. Однако из простых и интересных решений выделяется (для меня) только Readbox.info (онлайн) и nmdParser (оффлайн).  Оба инструмента обладают неплохими возможностями, однако хотелось более элегантного решения, так как значительно удобнее читать на читалке специализированном устройстве для чтения без особых мучений с моей стороны.

Поэтому я остановил выбор на программе Calibre, так как все-равно использую ее для организации библиотеки и генерации коллекций на устройстве. RSS клиент в программе весьма удобный, и несмотря на необходимость некоторых познаний для создания ленты, после настройки ленты и обновления, дальнейшие манипуляции больше не нужны. Еще можно отметить кросплатформенность программы и большое количество поддерживаемых форматов.
Дальше будет небольшое howto с картинками.



Рекомендую сразу переключиться в расширенный режим, так как обычный режим неудобен.



Будет примерно так:



Возмем для примера ленту habra. Добавляем о ее в настройки:



Эта лента уже должна работать, но к сожалению Calibre не достает функциональности сервиса Readability, и полный текст статьи он вытягивает не во всех случаях, поэтому нужно произвести дополнительные телодвижения, указав на элементы описывающие основной текст. Для меня проще использовать расширение Firebug для Firefox. Алгоритм примерно такой: открываем панель Firebug → находим интересующие элементы (подсвечиваются) → добавляем правила «вычленения» текста:




Для красоты добавим обложку, уберем стили и ява-скрипты, пропишем язык / теги / информацию:



Это и есть готовые настройки. Сохраняем настройки:



Для того, чтобы скачать ленту, необходимо проделать следующие «махинации»:



Не закрывая диалог, настроим автозагрузку новостей:



После этого настройки будут продублированы в списке



Результат:


Пример готовой книги в epub.

Файл настроек для calibre Habrahabr.recipe
Настройки созданных лент хранятся в %$APPDATA%\calibre\custom_recipes\
В мануале calibre есть страница о методах получения полнотекстовых статей. Я начал его перевод, постепенно выкладываю его здесь, чтобы не загромождать ненужными подробностями данный пост. Позднее планирую добавить готовые примеры и примеры работы там же.
Tags:
Hubs:
+20
Comments11

Articles