войти зарегистрироваться

PythonПроксируем RSS поток при помощи Python из песочницы

Одним из безусловно удобных способов получать новости, статьи и т.п. с различных сайтов — является RSS. Однако с каждым годом число лент неуклонно возрастает, кол-во фидов увеличивается, а времени на разгребание всего этого хозяйства становится все меньше и меньше. Очевидно — нужно как-то автоматически фильтровать статьи. Этим мы сегодня и займемся.

Linux для всехПарсер RSS на bash для Лостфильма: щадящий режим для RSS сервера, проверка скачанного из песочницы

Доброго времени суток!
Когда-то, благодаря этому топику, был написан неплохой парсер для Лостфильма. Сейчас я хотел бы поделиться собственной доработкой скрипта, связанной с изменением формата ссылок на Лостфильме, добавлением проверки на обновление ленты и проверки скачанного.

Прежде всего, что-бы снизить нагрузку на RSS сервер, при запросе ленты с помощью wget нужно использовать «If-Modified-Since:». Тогда, при отсутствии обновлений, мы не будем качать и обрабатывать всю ленту. Такой подход снизит нагрузку на сервер (и немного на наш компьютер).
Используем следующий вариант команды:

# Подготовка заголовка If-Modified-Since
lastmod="$( grep -m 1 Last-Modified response.out )"

header="If-Modified-Since:"${lastmod#*:}

Электронные книгиКак бесплатно автоматически получать RSS на Kindle каждое утро?



Именно этим вопросом я задался после покупки Kindle 3.

После долгих поисков я понял, что это невозможно. Тогда я решил создать своё решение этой проблемы…

Peer-to-PeerДобавляем информативности RSS-лентам от RuTracker.org

Введение


В своем первом топике я писал как организовать скачивание избранных раздач с любимого torrent-трекера, не отвлекаясь от чтения новостей. В этом топике будет описан оверкилл-способ, позволяющий еще более упростить процесс получения информации о каждой конкретной раздаче, пришедшей к нам в виде записи RSS-ленты. Как известно, сам по себе RuTracker.org публикует в RSS-ленте только ссылки на соответствующие ветки форума. Никакого описания раздачи элемент ленты не содержит, а хотелось бы иначе.

Предвидя возражения в духе «Хватит изобретать велосипед, лучше возьми готовые RSS. Например, от xpoft.ru» (спасибо egor_bulychev за наводку; без сарказма, правда, спасибо), скажу следующее: инструмент интересный, шустрый, лента с нужным содержимым формируется в несколько кликов мышью. Но, к сожалению, сгенерированные им RSS-ленты не радуют постоянством содержимого элементов: то придет исчерпывающая информация о раздаче, а то только название, да постер. Причем зависимости содержимого ленты от фактического описания раздачи на RuTracker.org выявлено не было. Такой расклад меня не устраивает: хочется и описание почитать, и media-info со скриншотами посмотреть, да еще и не переходя на оригинальную страницу с описанием.

СофтПолнотекстовые статьи из RSS для вашей читалки с использованием Calibre

Тема поднималась несколько раз. Однако из простых и интересных решений выделяется (для меня) только Readbox.info (онлайн) и nmdParser (оффлайн).  Оба инструмента обладают неплохими возможностями, однако хотелось более элегантного решения, так как значительно удобнее читать на читалке специализированном устройстве для чтения без особых мучений с моей стороны.

Поэтому я остановил выбор на программе Calibre, так как все-равно использую ее для организации библиотеки и генерации коллекций на устройстве. RSS клиент в программе весьма удобный, и несмотря на необходимость некоторых познаний для создания ленты, после настройки ленты и обновления, дальнейшие манипуляции больше не нужны. Еще можно отметить кросплатформенность программы и большое количество поддерживаемых форматов.
Дальше будет небольшое howto с картинками.

Peer-to-PeerКак качать торренты не выходя из Google Reader – способ для ленивых из песочницы

Введение


Я активно пользуюсь сервисом Google Reader для чтения RSS-каналов в общем и для отслеживания появления интересующих меня раздач на torrent-трекерах в частности. А также частенько качаю с торрентов любимые сериалы. В некоторый момент захотелось избавиться от промежуточных шагов между просмотром записи канала и скачиванием торрента и немного автоматизировать процесс вылавливания из сети интересной и нужной информации.

Вряд ли для кого-то окажется откровением то, что если не все, то почти все современные torrent-клиенты поддерживают загрузку RSS-каналов и даже автоматическую загрузку торрентов из этих каналов. Но, как правило, большая часть выдаваемых определенным каналом раздач мне просто не нужна. Да и дисковое пространство далеко не резиновое и выкачивать все возможные раздачи любимого, например, сериала не представляется возможным. Я не настолько большой фанат, чтобы держать на дисках одновременно несколько версий одной и той же серии или фильма.

На этом месте внимательный читатель непременно заметит: так ведь можно на каждый RSS-канал средствами torrent-клиента настроить фильтры и выкачивать только те раздачи, которые представляют реальный интерес. Заметит и получит резонный, по-моему, ответ: на все случаи жизни фильтры не настроишь. Нужен более универсальный вариант.

Таким вариантом для меня стала автоматическая закачка раздач, отмеченных в Google Reader. О том, как это реализовать подручными средствами, рассказано под катом.

Я пиарюсь iPADром – S03E05. Видеообзор софта для iPad

iPADром – еженедельный видеообзор приложений для iPad. В данном выпуске мы посмотрим на пять приложения: сборник видеоклипов ipad, гонки бабули на мопеде Turbo Granny, интерактивная RSS читалка Pulse News, приложение “фонарик” для эмуляции софтбокса Softbox Pro, игра в шашки Checkers HD.

Микроформаты (microformats)Разработчик создал инструмент для возвращения RSS в Twitter



Ранее в этом месяце предприниматель и блогер Джесси Стей заметил, что Facebook и Twitter полностью убрали поддержку RSS со своих сайтов. После множества протестов в техническом сообществе Facebook передумал и снова добавил ссылки на RSS в страницы Facebook. Twitter же никак не отреагировал.

Но сейчас один разработчик создал инструмент, использующий API Твиттера для создания RSS-потоков. Код проекта под названием «Twitter API 2 RSS» доступен на GitHub здесь.

Электронные книгиПрочитай меня, потрогай меня…

Так получилось, что у меня на праздники выдалась длинная поездка и я думал чем бы себя развлечь в пути. И выбор мой пал на чтение, а читать в наше время принято с новомодных электронных книг. Одно из таких устройств PocketBook 603 Pro и попало ко мне на тестирование, на время поездки.

FacebookПопулярное: RSS сайта + статистика Facebook

Обычно у меня не хватает времени для того, чтобы читать все новые статьи на сайтах, которые мне интересны. И, открывая Google Reader, я просматриваю пару последних записей RSS и просто нажимаю «отметить все как прочитанные».
Не эффективно, правда? Поэтому я решил сделать для себя естественный фильтр популярности контента: количество залайкавших его человек (аудитория Facebook более релевантна моим интересам).

Не думая долго я написал скрипт, который парсит RSS с сайта и сортирует статьи так, что самые популярные оказываются выше остальных.



И эти 50 строк кода очень упростили мне жизнь — теперь я только выбираю нужный мне сайт (адрес его RSS трансляции) и запускаю скрипт.
Код и комментарии по реализации под катом.