LangPrism – сервис краудсорсинг-перевода веб-содержимого


    Здравствуй, уважаемое хабрасообщество!

    Хочу представить вам наш проект по народному переводу Интернета LangPrism. Краудсорсинг уже давно и уверенно входит во все сферы деятельности человека и применение краудсорсинга для такой области, как перевод, не является чем-то особенно новым, однако мы решили взглянуть на это несколько с иной стороны и хотим представить вам свою точку зрения в виде нашего проекта. Возможно, многим он уже знаком по нашим переводам здесь, на Хабре (перевод, перевод, еще перевод), но, тем не менее, я решил опубликовать отдельный пост, чтобы рассказать о нем более подробно.

    Под катом вы также узнаете о новом Хабре на японском языке, не пропустите!


    Praeteritum


    Около двух лет назад Microsoft проводила среди своего сообщества программу лояльности ITBonus, в рамках которой она поощряла различные активности, связанные с продуктами Microsoft. В их числе был перевод технических статей и блогов по технологиям Microsoft. Тогда я активно участвовал в этой программе и даже пару раз побывал на первом месте в рейтинге. Однако с самого начала меня очень огорчало отсутствие возможности поделиться своим переводом. Не было никакого другого способа, кроме как отправить html-файл с переводом на почту организаторам. Не говоря уже о том, что редактировать перевод также приходилось вручную, используя инструменты разработчика в Chrome.
    Тогда и появилась идея, а почему бы не сделать такой сервис, который будет позволять переводчику прямо в контексте веб-страницы изменять ее содержимое, а другим пользователям просматривать это уже переведенное содержимое. Немного развив эту идею, стало ясно, что она очень схожа с концепцией Википедии.

    Большая Идея


    Наша большая задумка заключается в том, чтобы объединить идею Википедии и Google Translate. В буквальном смысле, вы посещаете веб-сайт на иностранном языке, используете LangPrism и, если в Википедии вы имеете возможность написать энциклопедийную статью, то LangPrism позволяет вам внести свой вклад за счет перевода веб-страницы на другой язык. При этом ваш перевод моментально становится доступен для других пользователей, что позволяет им читать зарубежные веб-издания на своем родном языке.



    Работает это все за счет установленного в браузер расширения LangPrism, которое существует для всех современных браузеров: родное расширение для Chrome и расширение в виде букмарклета для остальных браузеров. При активации расширения происходит следующее:

    • Содержимое исходной страницы отправляется на сервер.
    • Сервер возвращает фрагменты этой страницы, уже переведенные пользователями.
    • Наконец вы получаете пользовательский интерфейс перевода непосредственно на исходной странице и можете переводить нажимая правой кнопкой на предложениях.

    Один раз переведенное предложение на каком-то сайте остается в системе памяти переводов и может быть получено оттуда при дальнейших запросах. Таким образом, через некоторое время сама система будет выполнять роль глобальной памяти переводов, которая может быть использована не только для переводов веб-содержимого, но и в других областях, например, при переводе технических текстов, инструкций и пр.

    Praesens


    Сейчас расширением LangPrism для Chrome пользуются около 1400 человек, количество зарегистрированных пользователей около 420. Немалый вклад в перевод вносят также анонимные пользователи, суммарно переводя до 100.000 слов в месяц. Сайты для перевода выбирает само сообщество на основе своих предпочтений, распределение количества переведенного содержимого по доменам сейчас выглядит следующим образом:



    Всего за время существования проекта было переведено более 400.000 слов, что сопоставимо по объему с двумя текстами Войны и мир или пятью солидными 300 страничными книгами. Это весьма неплохо, учитывая, что цикл написания одной книги составляет примерно 1 год. Одним из наиболее популярных сайтов, который переводит наше сообщество, является технологический блог TechCrunch.



    На сегодняшний день роль модераторов в системе выполняют сами пользователи и простейший механизм борьбы со спамом. По аналогии с Википедией мы сделали постмодерируемую модель добавления перевода, так что любой ваш перевод сразу становится доступен для других пользователей. Сейчас одним из направлений нашей работы является разработка интеллектуальной технологии противодействия искажению смысла при переводе, которая позволит более точно управлять качеством процесса краудсорсинг-перевода.



    Совсем недавно на сервисе появился раздел Переводы, куда попадают наиболее популярные зарубежные статьи, найденные на просторах Интернета. Он предоставляет возможность для переводчиков переводить актуальные статьи и позволить другим людям быть в курсе всего самого интересного, что появляется в сети. Сам раздел оформлен наподобие популярных сейчас сервисов агрегации интересного контента. Этакий StumbleUpon по-русски. За помощь в проработке UX спасибо, Chipsadesign.



    Оборотной стороной всей видимой работы по переводу на веб-страницах является портал сообщества LangPrism. Он представляет собой некую социальную сеть для переводчиков, которая позволяет им решать вопросы взаимодействия при совместном переводе, составлять глоссарии и договариваться о стилистике перевода. Каждый переводчик имеет на портале сообщества свой профиль. Портал предоставляет живую ленту, которая показывает последние добавленные пользователями переводы, и своеобразный рейтинг пользователей сообщества собранный по количеству переведенных слов.

    Гарри Поттер на русском




    Сейчас одним из самых активных направлений работы переводчиков является перевод игры по мотивам книг о Гарри Поттере Pottermore. Браузерные игры оказались отличной нишей для применения LangPrism, поскольку никакого другого способа «натянуть» на них локализованный контент, если официальный перевод отсутствует, нет. В Pottermore используется flash, однако основной текст написан в html, что позволяет его легко переводить. Переводчики и раньше занимались переводом Pottermore, только выкладывали переводы на специализированных форумах, либо в группах ВКонтакте. Для его использования приходилось открывать два окна браузера и сопоставлять исходный текст с переводом, чтобы что-то понять. Теперь рады как сами переводчики, у которых появился удобный инструмент для перевода, так и простые игроки, которые случившееся называют не иначе, как магией. Пользователям LangPrism удалось за три недели полностью перевести Pottermore на русский язык, внеся вклад более чем в 80.000 переведенных слов.

    Хабр на японском языке




    Не так давно сервисом заинтересовались переводчики из Японии. Неожиданно они начали переводить Хабр на японский язык. Вы можете сами попробовать использовать ЯпоноХабр прямо сейчас. Если это направление продолжится, у нас есть шанс вскоре вещать для японохабраюзеров на их родном языке! Taishiro, Yukihiro thanks for contributing!

    Futura


    В планах на будущее – сделать LangPrism своеобразным стандартом обмена мультиязычной информацией в сети Интернет, поскольку уже сейчас на разных языках создано достаточно важной и полезной информации, которую нет смысла каждый раз генерировать заново. Достаточно просто проложить информационные, культурные мосты между различными языками и суммарная ценность, накопленная во всем мире, станет доступна каждому человеку. Как в свое время Википедия предоставила инструмент, который позволил сделать слепок всех знаний, которыми обладает человечество, так и мы хотим дать возможность донести эту и многую другую информацию для каждого пользователя в сети Интернет.

    Я бы хотел пригласить всех хабраюзеров к участию в этом проекте, и, если каждый, кто читает эту статью сделает хотя бы один перевод, поделится своей идеей или другой помощью, мы еще на один шажок приблизимся к этой поистине большой цели.
    Добро пожаловать на LangPrism.
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама
    Комментарии 25
    • +3
      Отличный сервис, ребята! Успехов вам! Будем рады помочь чем сможем!
      • +2
        Попробовал, весьма интересный сервис, на первый взгляд технически весьма неплох.
        Удачи вам в достижении вашей весьма глобальной цели!

        Вопрос: заметил, что количество переведенных слов в фиде отмечается по количеству слов в переведенном, а не в оригинальном тексте, так задумано или баг?
        • +3
          Спасибо :)

          Да, считать количество слов в оригинальном тексте было бы более правильным, но пока так. Поменяем.
        • –1
          Странно, что нет ссылки на Duolingo
          www.youtube.com/watch?v=cQl6jUjFjp4
          • +3
            А что вас удивляет? Покажите, пожалуйста, как при помощи Duolingo можно переводить сайты, чтобы другие пользователи могли пользоваться ими на своем родном языке?
            • +2
              Получается у вас более удобная и интерактивная версия notabenoid, очень интересный сервис, спасибо
              • +2
                Да, Notabenoid мы тоже очень любим и удачно его дополняем: они переводят титры и книги, мы переводим веб-сайты.
          • +4
            Очень полезный сервис!
            Несколько раз обращался к создателям разный сайтов с предложением оказания им помощи в локализации, но не получал ответа. Зато сейчас могу сам взять и перевести без них.
            • 0
              Есть ли в планах добавление возможности создания кампаний / проектов по переводу, чтобы направлять активности сообщества на перевод каких-то определенных сайтов?
              • +1
                да, сейчас такое объединение выполняется за счет механизма групп по переводу конкретных сайтов, например для Pottermore есть следующая группа
            • +2
              А есть возможность читать оригинал подглядывая перевод?
              • +4
                К сожалению, нет. Но идея хорошая, нам в голову не приходила.

                Думали над тем, что надо показывать оригинал при чтении перевода (во всплывающем окне при наведении мышью на предложение).
              • +1
                Хороший сервис, молодцы. Вот только по поводу плагина немного не понял, после его установки оно начнет отправлять на сервер все страницы, не различая конфиденциальные или нет или как?
                • 0
                  нет, страницы после установки он не посылает, он посылает страницу только тогда, когда пользователь активирует расширение, то есть нажимает на него
                • +2
                  Как будете бороться с рекламой, спамом в переведенных текстах?
                  • +3
                    — Пользовательская постмодерация членами сообщества.
                    — Механизм автоматической проверки корректности введенного перевода на основе поведенческих и лингвистических аспектов. Первую версию проверок скоро интегрируем.
                  • +2
                    Отличный проект. Русский краудсорсинг — это непросто )
                    Если не секрет, как прошел первый этап? Почему люди пошли к вам и стали переводить?
                    • +2
                      Спасибо :) Мы начали с друзей и с себя. Попросили сделать переводы интересных статей, которыми бы они хотели поделиться. Многие статьи получились очень читаемыми. Ссылки на них распространяли в соцсетях.
                      Затем мы пошли по пути героизации переводчиков, повышения их статуса. Это рейтинг и аватарки в панели. Людям это нравится. Свой профиль и «свои» переводы становятся уютными :)
                      Приходят люди, которые хотят видеть русские версии интересного контента для своих учеников или сообществ. Которые хотят поделиться им с кем-то. Для этого была сделана кнопка «Ссылка на перевод». Такие люди приходят и бескорыстно делают перевод, помогая другим.
                      Pottermore — отдельная тема. Мы поняли силу таких сообществ. Люди очень замотивированы темой и готовы распространять ее среди других, в виде перевода, например. Стратегия вин-вин — все в итоге выигрывают. Планируем работать с сообществами еще активнее.

                      Еще один эксперимент — создание ленты популярных статей langprism.com/feed
                      Любой может переводить статьи из ленты, и они автоматически начнут показываться там на русском. Хорошо, если образуется большое читающее сообщество, где кто-то переводит, а кто-то читает. По факту оно уже появляется.

                      В целом, мы стараемся пробовать, экспериментируем с различными подходами и смотрим реакцию пользователей. Так и будем двигаться дальше.
                      • +1
                        Тоже пробую работать с краудсорсинговыми проектами. Похоже, что рейтинги и ачивки и вообще оценка собственного вклада очень мотивируют крауд. К сожалению, в моем случае не так просто придумать как посчитать вклад. Буду пробовать.
                        Спасибо за рассказ ;)
                    • +1
                      Был не много удивлен увидеть этот проект тут. Саня молодец, пиарит всей семьей :) Но я рад, что вы не стоите на месте :) Молодцы! Горд за вас :)
                    • +2
                      Плохо работает на аякс-сайтах. Потестируйте тут: docs.angularjs.org/guide/, выловите кучу багов
                      • +1
                        Согласен, с динамическим контентом на LangPrism пока туго, но мы работаем над этим, спасибо за замечание
                      • 0
                        Решили проблему с динамическим контентом, ура!

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.