Python → Проксируем RSS поток при помощи Python из песочницы
Одним из безусловно удобных способов получать новости, статьи и т.п. с различных сайтов — является RSS. Однако с каждым годом число лент неуклонно возрастает, кол-во фидов увеличивается, а времени на разгребание всего этого хозяйства становится все меньше и меньше. Очевидно — нужно как-то автоматически фильтровать статьи. Этим мы сегодня и займемся.
Linux для всех → Парсер RSS на bash для Лостфильма: щадящий режим для RSS сервера, проверка скачанного из песочницы
Доброго времени суток!
Когда-то, благодаря этому топику, был написан неплохой парсер для Лостфильма. Сейчас я хотел бы поделиться собственной доработкой скрипта, связанной с изменением формата ссылок на Лостфильме, добавлением проверки на обновление ленты и проверки скачанного.
Прежде всего, что-бы снизить нагрузку на RSS сервер, при запросе ленты с помощью wget нужно использовать «If-Modified-Since:». Тогда, при отсутствии обновлений, мы не будем качать и обрабатывать всю ленту. Такой подход снизит нагрузку на сервер (и немного на наш компьютер).
Используем следующий вариант команды:
Когда-то, благодаря этому топику, был написан неплохой парсер для Лостфильма. Сейчас я хотел бы поделиться собственной доработкой скрипта, связанной с изменением формата ссылок на Лостфильме, добавлением проверки на обновление ленты и проверки скачанного.
Прежде всего, что-бы снизить нагрузку на RSS сервер, при запросе ленты с помощью wget нужно использовать «If-Modified-Since:». Тогда, при отсутствии обновлений, мы не будем качать и обрабатывать всю ленту. Такой подход снизит нагрузку на сервер (и немного на наш компьютер).
Используем следующий вариант команды:
# Подготовка заголовка If-Modified-Since
lastmod="$( grep -m 1 Last-Modified response.out )"
header="If-Modified-Since:"${lastmod#*:}
Электронные книги → Как бесплатно автоматически получать RSS на Kindle каждое утро?
Именно этим вопросом я задался после покупки Kindle 3.
После долгих поисков я понял, что это невозможно. Тогда я решил создать своё решение этой проблемы…
Peer-to-Peer → Добавляем информативности RSS-лентам от RuTracker.org
Введение
В своем первом топике я писал как организовать скачивание избранных раздач с любимого torrent-трекера, не отвлекаясь от чтения новостей. В этом топике будет описан
Предвидя возражения в духе «Хватит изобретать велосипед, лучше возьми готовые RSS. Например, от xpoft.ru» (спасибо egor_bulychev за наводку; без сарказма, правда, спасибо), скажу следующее: инструмент интересный, шустрый, лента с нужным содержимым формируется в несколько кликов мышью. Но, к сожалению, сгенерированные им RSS-ленты не радуют постоянством содержимого элементов: то придет исчерпывающая информация о раздаче, а то только название, да постер. Причем зависимости содержимого ленты от фактического описания раздачи на RuTracker.org выявлено не было. Такой расклад меня не устраивает: хочется и описание почитать, и media-info со скриншотами посмотреть, да еще и не переходя на оригинальную страницу с описанием.
Софт → Полнотекстовые статьи из RSS для вашей читалки с использованием Calibre
Тема поднималась несколько раз. Однако из простых и интересных решений выделяется (для меня) только Readbox.info (онлайн) и nmdParser (оффлайн). Оба инструмента обладают неплохими возможностями, однако хотелось более элегантного решения, так как значительно удобнее читать на читалке специализированном устройстве для чтения без особых мучений с моей стороны.
Поэтому я остановил выбор на программе Calibre, так как все-равно использую ее для организации библиотеки и генерации коллекций на устройстве. RSS клиент в программе весьма удобный, и несмотря на необходимость некоторых познаний для создания ленты, после настройки ленты и обновления, дальнейшие манипуляции больше не нужны. Еще можно отметить кросплатформенность программы и большое количество поддерживаемых форматов.
Дальше будет небольшое howto с картинками.
Поэтому я остановил выбор на программе Calibre, так как все-равно использую ее для организации библиотеки и генерации коллекций на устройстве. RSS клиент в программе весьма удобный, и несмотря на необходимость некоторых познаний для создания ленты, после настройки ленты и обновления, дальнейшие манипуляции больше не нужны. Еще можно отметить кросплатформенность программы и большое количество поддерживаемых форматов.
Дальше будет небольшое howto с картинками.
Peer-to-Peer → Как качать торренты не выходя из Google Reader – способ для ленивых из песочницы
Введение
Я активно пользуюсь сервисом Google Reader для чтения RSS-каналов в общем и для отслеживания появления интересующих меня раздач на torrent-трекерах в частности. А также частенько качаю с торрентов любимые сериалы. В некоторый момент захотелось избавиться от промежуточных шагов между просмотром записи канала и скачиванием торрента и немного автоматизировать процесс вылавливания из сети интересной и нужной информации.
Вряд ли для кого-то окажется откровением то, что если не все, то почти все современные torrent-клиенты поддерживают загрузку RSS-каналов и даже автоматическую загрузку торрентов из этих каналов. Но, как правило, большая часть выдаваемых определенным каналом раздач мне просто не нужна. Да и дисковое пространство далеко не резиновое и выкачивать все возможные раздачи любимого, например, сериала не представляется возможным. Я не настолько большой фанат, чтобы держать на дисках одновременно несколько версий одной и той же серии или фильма.
На этом месте внимательный читатель непременно заметит: так ведь можно на каждый RSS-канал средствами torrent-клиента настроить фильтры и выкачивать только те раздачи, которые представляют реальный интерес. Заметит и получит резонный, по-моему, ответ: на все случаи жизни фильтры не настроишь. Нужен более универсальный вариант.
Таким вариантом для меня стала автоматическая закачка раздач, отмеченных в Google Reader. О том, как это реализовать подручными средствами, рассказано под катом.
Я пиарюсь → iPADром – S03E05. Видеообзор софта для iPad
iPADром – еженедельный видеообзор приложений для iPad. В данном выпуске мы посмотрим на пять приложения: сборник видеоклипов ipad, гонки бабули на мопеде Turbo Granny, интерактивная RSS читалка Pulse News, приложение “фонарик” для эмуляции софтбокса Softbox Pro, игра в шашки Checkers HD.
Микроформаты (microformats) → Разработчик создал инструмент для возвращения RSS в Twitter

Ранее в этом месяце предприниматель и блогер Джесси Стей заметил, что Facebook и Twitter полностью убрали поддержку RSS со своих сайтов. После множества протестов в техническом сообществе Facebook передумал и снова добавил ссылки на RSS в страницы Facebook. Twitter же никак не отреагировал.
Но сейчас один разработчик создал инструмент, использующий API Твиттера для создания RSS-потоков. Код проекта под названием «Twitter API 2 RSS» доступен на GitHub здесь.
Электронные книги → Прочитай меня, потрогай меня…
Так получилось, что у меня на праздники выдалась длинная поездка и я думал чем бы себя развлечь в пути. И выбор мой пал на чтение, а читать в наше время принято с новомодных электронных книг. Одно из таких устройств PocketBook 603 Pro и попало ко мне на тестирование, на время поездки.Facebook → Популярное: RSS сайта + статистика Facebook
Обычно у меня не хватает времени для того, чтобы читать все новые статьи на сайтах, которые мне интересны. И, открывая Google Reader, я просматриваю пару последних записей RSS и просто нажимаю «отметить все как прочитанные».
Не эффективно, правда? Поэтому я решил сделать для себя естественный фильтр популярности контента: количество залайкавших его человек (аудитория Facebook более релевантна моим интересам).
Не думая долго я написал скрипт, который парсит RSS с сайта и сортирует статьи так, что самые популярные оказываются выше остальных.

И эти 50 строк кода очень упростили мне жизнь — теперь я только выбираю нужный мне сайт (адрес его RSS трансляции) и запускаю скрипт.
Код и комментарии по реализации под катом.
Не эффективно, правда? Поэтому я решил сделать для себя естественный фильтр популярности контента: количество залайкавших его человек (аудитория Facebook более релевантна моим интересам).
Не думая долго я написал скрипт, который парсит RSS с сайта и сортирует статьи так, что самые популярные оказываются выше остальных.

И эти 50 строк кода очень упростили мне жизнь — теперь я только выбираю нужный мне сайт (адрес его RSS трансляции) и запускаю скрипт.
Код и комментарии по реализации под катом.