Pull to refresh

О переводах

Большая часть документации написана на английском языке. Хорошо бы всем знать английский :) Но не все его знают. А значит не все программисты и админы могут прочитать RFC, ещё меньшее число смогут прочитать и всё понять, и от этого будут страдать пользователи программ / клиенты сетей. Проблему с переводами нужно как-то решать.

Что мы имеем сейчас? Есть машинный перевод и ручной перевод. На машинный перевод я пока полагаться не хочу. С ручным переводом всё хорошо, но есть проблема: огромное число отдельных статей с переводами, у которых чаще всего связующее звено с оригиналом — только ссылка. Если в оригинале что-то изменилось, в переводе это уже не появится. Если перевод выложен не на вики, то ошибки в нём возможно никто уже не исправит. Такие переводы теряют свою пользу. А ведь человек тратил на него своё время, выкладывал на всеобщее обозрение, чтобы текст был полезен не только ему. При всём моём уважении к ресурсу translated.by, он ничего не может сделать с актуальностью материала.

Моя идея такова: сделать базу переводов в виде готовых предложений. Пользоваться этим можно, к примеру, через плагин к браузеру, который будет ходить в базу. Причём эта база может быть и локальной.

Минусы:
  • Большой трафик к базе;
  • Нужен очень быстрый движок базы;
  • Нужен алгоритм выделения предложений из текста (хотя возможно не обязательно предложения, можно просто весь текст скидывать);
  • Нужно разработать протокол обмена между клиентом и сервером;
  • Нужно написать софт (клиент и сервер);
  • Анонимность сомнительна. Для этого нужно держать локальную базу, которая будет периодически обновляться с основной.


Плюсы:
  • Переведённые тексты не будут отставать от оригинала. Изменился текст — либо нашёлся готовый перевод, либо он будет показан «как есть», и кто нибудь его переведёт, но старого текста уже не будет.
  • Можно делать переводы на разные языки, при этом предложения будут эквивалентны, и автоматически будет доступен перевод между другими языками.
  • При переводе программа может предлагать похожие уже переведённые предложения, что будет с увеличением базы ускорять процесс.
  • Возможна «социальность» — хотелось бы что-то похожее на википедию.


Что должно быть в базе?
  • Сам текст (фраза/предложение/словосочетание, или отдельное слово);
  • Язык этого текста;
  • Уникальный номер;
  • Ссылка на источник;
  • Флаг оригинала — если установлен, то текст менять нельзя, даже если текст написан с ошибкой.
  • Таблицу отношений между текстами разных языков. Здесь же видимо будут и тэги, т. к. текст может переводиться по-разному в зависимости от тематики;
  • Таблица пользователей;
  • Таблица истории изменений.


Хотелось бы также следующие «мелочи»:
  • Зарегистрированные пользователи могут вносить правки, а незарегистрированные — только предлагать изменения.
  • Легко сделать форк проекта — база должна быть доступна для полного скачивания.


Юридические вопросы: очень хотелось бы писать текст в базу под свободной лицензией, чтобы каждый пользователь был уверен, что он переводит текст не для владельца базы, я для всех. Но может ли вообще перевод быть под какой-то лицензией? Нужно ещё учесть, что в базе будут храниться переводы отдельных предложений, а не весь текст.

Даже при наличии большого числа минусов, проект должен существовать, т. к., как мне кажется, это единственный способ качественно и быстро (не дожидаясь официальных переводов, если они вообще появятся) переводить документацию.

Цель данной статьи — услышать полезные предложения, возможно даже ссылки на готовые аналогичные проекты, или если таких проектов нет — найти единомышленников для написания необходимого софта.
Tags:
Hubs:
You can’t comment this publication because its author is not yet a full member of the community. You will be able to contact the author only after he or she has been invited by someone in the community. Until then, author’s username will be hidden by an alias.