Я пиарюсь

индекс
146,06

HABRAтопик в PDF

Это еще не полноценный сервис, но…

Уже несколько раз проблема перевода html-страницы в pdf проскакивала в постах на хабре. К сожалению, все предложенные решения меня не устроили и пришла идея сделать свой сервис.

Так появилась "Сохраняшка".

Сохраняшка


Базовыми идеями сервиса стали:
  1. Сохранение в pdf только нужной информации, без рекламы и другой шелухи (шаблоны);
  2. Создание шаблонов pdf любого сайта;
  3. Возможность изменения размера и ориентации документа, шрифта, колонтитулов и других параметров страницы;
  4. Сохранение как отдельной брошюры, так и «книги» пригодной к сшиванию;
  5. Формирование книги из потока RSS;
  6. Возможность подключения статьи к уже существующей «книге»;
  7. Кэширование сгенерированных файлов;


На работе сервис пришелся на УРА: не приходится отдельно лазить по сайтам — каждый сайт в отдельной книге. Книги сайтов разбиты по месяцам. Каждый может распечатать или сохранить нужные страницы с книг. Даже если на сайте уже нет статьи, то вполне возможно, что она есть в книге. Новые добавления каждый день.

Конечно, пока еще не все реализовано:
В частности хотелось бы иметь книги блогов с Хабра. Они есть, но туда попали только те статьи, которые были получены с RSS после создания сервиса. Я отписался на support@habrahabr.ru с запросом о помощи по получению всех списков статей, но там молчат. Парсить отдельно весь Хабр — это решение в лоб и «некраcиво». Так что пока ждем ответа. Хотя может кто с Хабравчан подскажет идею…

Кстати по поводу идей. Хотелось бы услышать Ваше мнение/замечания/предложения по поводу сервиса.
Если сервис окажется востребованным, то выложу его полную версию в интернет (та что сейчас лежит на http://www.crysan.jino.ru/ — является тестовой, ограничена в функциональности и подвержена хаброэффекту.

Топик получился немного сумбурный но надеюсь на Ваше понимание и интерес.

P.S.
Ребята, если минусуете топик, то хотя бы в комментах отпишите, за что Вы это делаете (ну конечно если Вы не Тролль).
Указывайте в шаблоне конкретную страницу!
Не стоит также вводить в шаблон хабра другие адреса страниц, ведь один шаблон — один сайт, Вы ведь это должны понимать-то!

P.P.S.
Немного подправил код. Теперь статья выводится с комментариями. Конечно кривовато, но это на скорую руку.

P.P.P.S.
Решил некоторые указанные в комментариях проблемы. Улучшил отображение документа.

Р.P.P.P.S.
Из-за нехватки времени проект был закрыт/продан/отдан в хорошие руки.

+126
17 февраля 2010, 08:59
101

комментарии (91)

+4
n3m0 #
Идея годная и пригодная!

Сохранил ваш топик в pdf, заметил баг. В хидере документа (там где текущая страница пишется) не правильно отобразился ">"
0
cry_san #
Да, Вы правы. Видимо немного не верно обрабатываются спецсимволы. Буду править.
+3
cry_san #
Пока подправил хидер :)
+8
armor #
Жаль нет функции сохранить вместе с комментариями.
+8
karasov #
Да-да, порой в них ценности даже больше, чем в топике… Ну по крайней мере они в большинстве случаев топик весьма существенно дополняют.
0
cry_san #
Цитирую: "(та что сейчас лежит на www.crysan.jino.ru/ — является тестовой, ограничена в функциональности и подвержена хаброэффекту)".
Комментарии тоже сохраняются по требованию пользователя. Однако там небольшпя проблема в СSS, которую сейчас решаю.
Но эта возможность есть!
+2
karasov #
Ну если бы вы указали, что это возможность есть или, хотя бы, планируется, то и не было бы комментариев на эту тему, сами же просили «предложения», вот и получайте, люди же не телепаты, откуда они могут знать есть такая возможность или нет.
+3
cry_san #
Да, Вы правы!
Извините…
+1
Zig #
А мне чаще всего ценна именно статья, а не комментарии. Могли бы вы, поставить уже в тестовом сервисе галочку «без комментов»?

А сервис отличный!!! Если будете выкладывать полную версию — обязательно анонсируйте! Пользователей будет)
0
cry_san #
Хорошо, может быть сегодня и сделаю.
0
PhotoGraFFer #
А то и только плюсовые комментарии:)

Или вообще возможность сохранять статью с указанием минимального значение заплюсованых комментов.
0
cry_san #
И + и -. Нет только нулевых. Проверьте на других топиках.
+2
Alroniks #
Надеюсь на успешное развитие проекта. Порой приходится сохранить статью, чтобы потом почитать в offline. Сохранять html страницу или mht-архив можно, но не удобно. PDF — самое то. Спасибо. За такой сервис и кармы дать не жалко.
+1
andoriyu #
а чем это отличается от банальной печати в pdf? или это для тех у кого нет возможности так сделать?

p.s.
вот что получается при простой печати: dl.dropbox.com/u/963415/habra.pdf, смущает только отступ справа…
+2
andoriyu #
еще, сделайте букмарк для печати текущей страницы. чтобы не делать кучу лишних движений — кликнул по букмарк бару и получил пдфку.
+2
cry_san #
Хорошая идея. Спасибо.
0
cry_san #
От банальной печати отличает стилизация по макету. Т.к. макеты могут быть разные, то и получаемый на выходе материал, тоже может быть другим (например измененный шрифт, его размер положение текста на странице, книга, брошюра, буклет и т.д.).
А также имеет место автоматизация: сохранять в pdf по одной странице — слишком накладно. Да и потом объединять их как? Тоже геммор. :)
0
andoriyu #
>А также имеет место автоматизация: сохранять в pdf по одной странице — слишком накладно. Да и потом объединять их как? Тоже геммор. :)
эмм, что-то я тогда этот сервис не понял. куда там можно список ссылок засунуть?

>От банальной печати отличает стилизация по макету. Т.к. макеты могут быть разные, то и получаемый на выходе материал, тоже может быть другим (например измененный шрифт, его размер положение текста на странице, книга, брошюра, буклет и т.д.).

Ага, посмотрел разницу между пдфкой с вашего сайта и своей. опять же можно свою css'ку замутить :)
0
cry_san #
> эмм, что-то я тогда этот сервис не понял. куда там можно список ссылок засунуть?
в интернет версии пока списка нет :) Вы ведь читали, цитирую «Базовыми идеями сервиса стали:»

>Ага, посмотрел разницу между пдфкой с вашего сайта и своей. опять же можно свою css'ку замутить :)
в этом и суть. А в виртуальном принтере такое есть?
0
andoriyu #
Ну там про RSS только было :) Насколько я знаю при печати страницы используется другой шаблон, мы же меняем стандартные css'ки к некоторым сайтам для себя, что мешает поменять на печати? опять же ваш сервис тут удобнее.
p.s.
еще фичу придумал: генерировать пдф вообще все всяких форм(у меня для себя такой сервис был, потом забросил) — урл страницы которую нужна распечатать(закодирован в base64) передается в GET запросе, а возвращается уде pdf'a. получается можно делать листы загрузок без гемороя.
+1
coolspot #
Расскажите пожалуйста, как это технически реализовано.
0
cry_san #
Генерация PDF с помощью mPDF.
Думаю Вас это интересовало?
+1
coolspot #
Да, спасибо!
–1
sashaeve #
Сайт не работает в IE8, а в FireFox выдал пустой PDF. А чем вам это решение не подошло?
0
cry_san #
А можно узнать что за ссылку вы вводили и с какими параметрами?
А то решение слишком специфичное, работает, наверное, только в Windows и еще очень сырое.
0
sashaeve #
Странно, но второй раз для этого топика стработало.
0
cry_san #
Может играет роль то, что хостинг на Джино, и mPDF критична к памяти и ресурсам процессора.
А может и микроХабраэффект…
0
andoriyu #
я открывал в сафари из макос.
0
91koff #
Идея отличная, автор — молодец! Есть предложение развить идею до сохранения в формат электронных книг, например, lrf. Можно будет вечером, уходя с работы закинуть интересующие тебя топики с Хабра на eBook читалку и почитать по дороге домой. Ну, и как уже высказывались выше, было бы здорово иметь возможность сохранять комментарии.
0
cry_san #
Можно и в lrf. Только нужно будет разобраться в формате файла.
+2
verych #
Пожелание. Хочу собирать PDF журнал с хабра за прошлый месяц с содержанием. Одним кликом.
+3
cry_san #
Легко, но немного позже :)
0
nurakhov #
Было бы неплохо иметь возможность делать выборку по тегам или по блогам также одним кликом.
+1
cry_san #
Будет.
0
vadimus #
Еще пожелания:

— перенесите в другой блог, например, свободные идеи. Пусть выйдет на первую, достойно,
— добавить опцию без комментариев, бывает нужно,
— создайте у себя возможность публиковать сформированные книги. Можно сделать рейтинг книг.
0
vadimus #
И еще предложение:

— возможность предлагать разные шаблоны верстки. И даже предлагать дизайнерам возможность создавать свои шаблоны на основе HTML и CSS.
+1
cry_san #
Хорошо. Достойные идеи.
0
GoshaTobolsky #
а я вот сделал слепок с одного топика, а он мне обрезал весь топик и оставил только комменты… это как понимать??

и еще вопрос: можно где нибудь настройку, чтобы он делал тупо принтскрин страницы?
динамический размер шрифта не всегда нужен, мне проще приблизить на айтаче…
+1
GoshaTobolsky #
dl.dropbox.com/u/2216732/%D0%BA%D0%BE%D0%BD%D0%B5%D1%86_%D1%81%D0%B2%D0%B5%D1%82%D0%B0_2012.pdf — можете сами насладиться комментами…
+1
cry_san #
Да, Вы правы. Нашел где ошибка. Исправляю.
+1
GoshaTobolsky #
Отлично, спасибо :)
0
cry_san #
Исправил.
+1
phillennium #
Няшка!
0
cry_san #
Надеюсь это только начало чего-то большого и вкусного. Хотя бы и для обслуживания одного Хабра.
0
Dennis #
+5
0
Aux #
Хорошее начинание! Надеюсь у вас хватит ресурсов довести начатое до конца, сервис однозначно клёви!
0
tenebro #
Какая незамысловатая идея, но какая польза в перспективе, а касательно хабра и сейчас. Заплюсовать не могу, но пожелаю дальнейшего развития, кучи шаблонов и множества благодарных пользователей.
0
Xronos #
А можно шрифты покрасивее?
0
cry_san #
Можно. Будете сами потом выбирать.
0
malyshev #
Хорошая вещь.

Пару фичреквестов:

1.

2.
0
malyshev #
упс… случайно отправилось.

1. Сделать выбор базового шрифта, думаю удобен будет выбор из списка (Aria, Times New Roman и т.д.)
2. Сделать опциональным включение/выключение комментарием
0
cry_san #
Ок
0
ZogG #
спасибо, только вчера думал о таком. только я хотел программу на н900(не всегда онлайн да и в пдф удобнее). но пока программы нет, буду юзать этот сервис
+1
q0p #
Может кому пригодится… pdfmyurl.com/ — зарубежный сервис который, понятно даже по адресу, конвертирует любую страничку в пдф формат.
0
techno #
Еще как пригодится, спасибо!
0
prizrakrm #
было бы неплохо, на мой взгляд, давать более осмысленное название файлу, а не 4ddbfb811477580d7d84c2274df8ddd5.pdf :)
0
cry_san #
Все зависит от параметров страницы. И такое имя файла — комбинация адреса и параметров. Так работает простой файловый кеш. Хотя можно его организовать и по другому :)
0
prizrakrm #
хм. не выгоднее было-бы читать , а не зависеть от параметров страницы?
впрочем это всего-лишь пожелание, учитывать его или нет — вам решать ;)

ps: с пхп я знаком ;)
–1
prizrakrm #
упс, порезалось <title>
0
NumberOne #
а в fb2 такое можете?
0
cry_san #
Постараюсь
0
NumberOne #
было бы очень здорово!
+1
py3u #
почему бы создателям Хабра такое не встроить?
0
cry_san #
а кто их там разберет…
0
fl00r #
какую библиотеку pdf генерации используете? prawn?
0
cry_san #
+2
Quiz #
Это несомненный ПЛЮС!
Огромное спасибо автору!
–1
k0d #
ловите идею — добавьте банерорезалку (тот же Adblock) и предосмотр, что бы не удалила нечего лишнего
0
kirbak #
Няшный сервис!
+1
We1tkinD #
Пожелание: кнопка на панель браузера.
+1
techno #
Отлично! Вот бы такой же сервис для любых ссылок, а не только для Хабра и тысячи людей, сидящих за корпоративными фаероволлами сказали бы вам спасибо! ;-)
0
Alroniks #
А можно ли предусмотреть возможность заливать файл извне? Например, формата *.mht. А то есть небольшая подборочка на диске, а искать заново все статьи на хабре сложно, тем более некоторых уже может и не быть. Я думаю, добавить чтение того же кода из файла не так сложно.

Надеюсь, мое мнение будет иметь значение.
0
cry_san #
> тем более некоторых уже может и не быть
А разве топики удаляются?

> Я думаю, добавить чтение того же кода из файла не так сложно.
Вроде не сложно… Так что попробую, но не обещаю в скором времени.
0
Alroniks #
Ну топики не удаляются. Но есть топики, которые не нравятся хабрасообществу и минисуются, а для меня там есть полезная информация. Такие топики обычно прячутся авторами.
0
cry_san #
Теперь понятно.
–1
Rodman #
На мой взгляд проще для использования гаджет, а не сайт на который надо переходить и копировать ссылку
0
qazwsx #
Гаджет сделать не долго, согласен он нужен.

Еще бы не плохо после текста ссылки в тексте выводить в скобках ее адрес.
–1
cry_san #
>Еще бы не плохо после текста ссылки в тексте выводить в скобках ее адрес.
А зачем?
–1
qazwsx #
Чтобы при распечатке было видно.
0
qazwsx #
Стоит еще проверять вводимые значения, а то PDF не формируется с теми, что я ввел.
0
cry_san #
Ок
0
qazwsx #
Блин, и правда супер! Как сохранить PDF с комментариями?
И желательно сделать опцию, чтобы они как-то очень компактно располагались :) Например лого 20х20, логин и текст коммента в одной строке. Переносы строки в тексте коммента можно сделать иконкой стрелочки как кнопке Enter. Тогда будет очень удобно распечатывать!
0
qazwsx #
Еще одно скромное пожелание: сделать личный кабинет, чтобы я смог сохранить свои настройки формирования PDF. Ну и найти весь список сформированных PDF тоже было бы приятно увидеть :)
0
qazwsx #
Тогда и
И желательно сделать опцию, чтобы они как-то очень компактно располагались :) Например лого 20х20, логин и текст коммента в одной строке. Переносы строки в тексте коммента можно сделать иконкой стрелочки как кнопке Enter. Тогда будет очень удобно распечатывать!

можно будет легко сделать, путем добавления в личном кабинете своего стиля, с которым будет формироваться PDF.

Мне кажется у людей будет много идей, так может стоит создать на проекте блог разработчиков с возможностью подписки по RSS или Емайл.
0
cry_san #
Запланировал. Спасибо за идею.
0
GoshaTobolsky #
подумалось, а можно сделать такой вид сервиса:
в адресную строчку вбиваем «www.crysan.jino.ru/(адрес поста на хабре целиком)» и жмем энтер. по окончании работы скриптов браузер не открывая странички предлагает сразу сохранить PDF :)

п.с. на момент этого поста сайт не открывается...:(
–2
Untit1ed #
1. Проверять домен в строке поиска.
2. Проверять на наличие сгенерированого пдфа в базе (по скорости сложилось впечатление что каждый раз генерируется новый пдф на один и тот же запрос)
3. Главная страница и так пустая, зачем туда было вставлять скрытые формы? 3 клика + анимация на то, чтобы сгенирировать первый пдф, 2 клика на каждый последующий. Неудобно и неоправдано.
0
Timon #
Очень бы хотелось сохранить избранные посты из своего профайла в единый pdf-документ. Если бы еще по блогам систематизировал и с содержанием, то вообще бы цены не было.
0
verych #
Почему сайт перестал работать? Я вижу 403-ю
0
cry_san #
Извините за временные перебои.
Все будет работать.
0
BReal #
Классный сервис, как-раз скоро буду 3 недели жить без интернета. Очень пригодится.

Подскажите только, как заPDFить все избранное разом? И если это возможно, то: с 50 до 1 страницы тоже…

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.