Pull to refresh
45
0

User

Send message
Онлайновые сервисы, GUI-программы, куча всего windows only… а есть простая кроссплатформенная консольная утилита, которую можно соединять с произвольными другими? Я пока нашел только Antiword.
Самый лучший способ сравнивать версии .doc — использовать монструозный проприетарный офисный пакет, не работающий на ряде платформ.

Самый лучший способ сравнивать версии текста — использовать простой текст и нормальные системы контроля версий по вкусу.
P.S.: man antiword :)
в т.ч. antiword -f foo.doc
Хорошо бы, угу. Хотя я обычно получаю файлы, в которых заголовки оформлены нажатием кнопочки «жирный» и выбором размера шрифта. Ну и всё в этом духе. В результате проще взять чистый текст и привести его в норму, чем возиться с первоначальной кашей. В хорошем тексте то или иное выделение встречается довольно редко и его без труда можно перенести вручную.
0. Предложенный вариант не предназначен для затыкания всех дыр. Всякий инструмент хорош на своем месте.
1. Нет, если диффать. Хотя it depends.
2. Нет, если диффать. Хотя it depends.
3. Иногда да. Сильно зависит от типа документа и ситуации.

Не знаю, зачем нужен спеллчекер, но без vim редактировать текст очень неудобно. Опять же, всё зависит от человека.
Про «итерации вопрос-ответ» не понял. Одно точно могу сказать: пока OOo запускается, я уже внесу правку через vim и отправлю документ на печать.

Antiword не сохраняет картинки, да. Их можно втыкать отдельно. Это будет разумно, если вы составляете документ самостоятельно.

Насколько сложное форматирование? reST довольно мощный, это не вики-разметка. Если не хватает — разумеется, не надо его притягивать за уши, берите LaTeX.

Еще раз: описанное решение не призвано заткнуть все дыры.
Не знаю, потому что винду я снес несколько лет назад =)
Из docx обычно извлекаю текст через Google Docs.
Значит, вам не нужен контроль версий, вас устраивает форматирование входящих документов и вам нравится интерфейс/скорость офисных пакетов. ;-)
… и да, скорость работы — лишь одна из нескольких проблем. Вы не читали топик или троллите.
Компьютер, на котором летает опенофис, и компьютер, на котором летает Firefox с кучей вкладок, редактор, плеер,… И опенофис — это очень разные компьютеры.

Опенофис действительно часто тормозит. Если пользователь этого не замечает, у него либо весьма дорогой компьютер, либо просто привычка к заторможенности программ.
Чтобы нормально работать, а не ждать, пока очнется текстовый процессор. И чтобы печатать, а не щелкать мышью. И диффы в VCS… кажется, я повторяюсь. Прочтите топик, там всё сказано.
reST — не LaTeX, его нельзя использовать совсем для всего. Это одна из самых мощных и расширяемых разметок среди легко читаемых (наряду с Markdown, Textile и всякими вики-разметками).

Тем не менее, колонтитулы поддерживаются. И вот, кстати, неплохой tutorial по презентациям (в сравнении с LaTeX). Рассматривается и отбивка страниц (по заголовкам, вроде). Вполне в духе этой заметки. Жаль, я только сейчас на этот tutorial наткнулся.

В целом, reST, наверно, самый популярный язык для документации программ, написанных на Python. Питонисты обычно используют reST в сочетании со Sphinx. Документация самого Питона так и подготовлена. Естественно, это подразумевает легкое построение содержания произвольной глубины по набору документов (т.е. каждую главу можно хранить в отдельном файле).
Если принимающая сторона хочет именно в формате MS Word и именно в исходном форматировании, нужно использовать офисный пакет, причем желательно тот же самый. Ну или сменить принимающую сторону. :-)
Если принимающая сторона согласна на OpenDocument, достаточно rst2odt.
Если нужен документ в MS Word, но допустима замена неряшливого форматирования на правильное, можно к концу цепочки добавить OpenOffice (для odt→doc). Тогда офисным пакетом можно будет пользоваться в 2 клика, тормоза не повлияют на работу. Кстати, наверно, можно и без GUI, я просто не в курсе.
Есть подозрение, что не каждый человек хотя бы раз в жизни заканчивает истфак. Некоторые учатся и на других факультетах. Соответственно, ориентируются на весьма сомнительные знания, вынесенные из школы, а также выхолощенные временем рассказы немолодых родственников. У меня бабушка тоже помнит про войну танцы отсутствие преступности, пока не начнешь задавать точные вопросы, уже зная ответы.
Пока у нас не стали красить город (с 1998 года), он был пасмурным в любое время года))
Во дворах еще хуже. С одной стороны, надо парковки строить. С другой — если нет мест и постоянно пробки, зачем покупать автомобили? Странные люди. С третьей — был бы нормальный общественный транспорт, больше людей отказалось бы от автомобилей. Пешком ходить не везде удобно; через весь город — час-полтора, на работу так не побегаешь.
Европа у нас на нескольких улицах, да и то если уши заткнуть. Везде очень пыльно, грязно, кругом позднесоветская заброшенность с золотой каёмкой капитализма. Ресурсов у города предостаточно, но тратятся они по-идиотски. Напр., на Плотинке поставили две роскошные, но абсолютно неудобные металлические «беседки» и ежегодно не по разу перекладывают брусчатку на главной площади; развесили кругом какие-то горшки с цветами, которые быстро покрываются слоем пыли. Никто из власть имущих не думает о целесообразности, только о, эмм, бизнес-партнерах, или как бы их назвать.
Не в точности по теме, но может быть полезно желающим легко и быстро работать с документами без медленных офисных пакетов и без необходимости изучать сложные языки разметки:

1. antiword читает .doc и выводит простой текст;
2. для простого текста есть разные простые языки разметки, включая ReST;
2. утилиты rst2* конвертируют текст из ReST-разметки в произвольные форматы.

ReStructuredText (ReST) — чрезвычайно удобная разметка документов. Она и простая, и мощная, и расширяемая, и стандартна для всего, что связано с Питоном. Ессно, затыкает не все щели, но годится для огромного количества случаев.

Например, нам пришел документ в формате MSWord, мы хотим что-то быстро исправить в нем и сохранить себе текст/шаблон на будущее:

$ antiword смета.doc > смета.txt
$ vim смета.txt # упорядочиваем форматирование, правим текст
$ rst2pdf смета.txt -o смета.pdf

Готово, красивый PDF можно посмотреть и распечатать. Кстати, удобно в процессе редактирования исходника держать PDF открытым, скажем, в Okular. При экспорте из ReST в PDF (а это можно делать и автоматически) Okular сразу же обновит содержимое, не сбрасывая открытую страницу. Получается почти моментальный предпросмотр. И там же (в Okular) можно распечатать документ.

Я обычно добавляю еще файл стилей (один и тот же более-менее подходит всем документам, можно расширить под конкретный документ).

Ну и не забываем про rst2html, rst2latex и даже rst2odt.

Более того — о да! — ReST-файлы хорошо хранятся в VCS. Значит, если что-то изменилось в официальном документе, вы всегда будете иметь читабельные диффы для любых дат. Для входящих можно тоже хранить исходные версии, чтобы легко переносить именно изменения в ReST-файлы.

Повторюсь, это относится к относительно простым документам (которых большинство).

Information

Rating
Does not participate
Location
Россия
Registered
Activity