«Переведем Coursera»: как сделать платформу для перевода лучших курсов мира на русский язык

    24 марта ABBYY Language Services и центр Digital October объявили об официальном запуске краудсорсингового проекта «Переведем Coursera». Его цель — на волонтерской основе перевести лучшие курсы Coursera на русский язык и сделать их доступными для всех пользователей Рунета. Зарегистрироваться и приступить к переводу лекций можно уже сейчас на сайте проекта.

    Пока мы разрабатывали и готовили к запуску этот проект, произошло много интересного. Мы решили массу организационных и технических задач, познакомились с большим количеством интересных людей, в том числе с яркой командой и основателями Coursera, а также с командой нашего локального партнера по этому проекту Digital October. Думаем, что вам будет интереснее узнать про технологии, поэтому сейчас расскажем, из чего состоит и что умеет платформа, которую мы разработали. Почти наверняка это не последний пост о проекте, так что пишите в комментариях, о чем еще вы бы хотели узнать.

    Разработка началась в прошлом году, и до вчерашнего дня платформа находилась в стадии закрытого бета-тестирования, участие в котором приняли сотрудники ABBYY, Digital October, а также студенты и молодые специалисты Московского государственного университета, Российского государственного гуманитарного университета, Московского городского психолого-педагогического университета и других вузов. Благодаря комментариям первых переводчиков наши специалисты смогли доработать платформу, сделать ее более удобной и полностью подготовить к работе.

    В основе ресурса лежит разрабатываемая ABBYY Language Services облачная платформа для автоматизации перевода SmartCAT. Как вы помните, эта система позволяет использовать в работе современные технологии переводческой индустрии: память переводов, автоматизированную поддержку целостности терминологии, машинный перевод. Все это собрано в удобном интерфейсе редактора, который устроен так, чтобы максимально повысить производительность пользователя. В «Переведем Coursera» эти профессиональные технологии доступны всем желающим — для «включения» в работу не потребуется специальная подготовка. Чтобы проект был интересен волонтерам, наши разработчики добавили в систему несколько дополнительных функций, о которых мы расскажем ниже.

    Все желающие могут зарегистрироваться на сайте проекта, выбрать любой понравившийся курс и приступить к работе с ним. Тексты лекций поделены на предложения, временных рамок для перевода нет: только вы решаете, сколько времени потратить на участие — перевести 2–3 предложения или же 20 страниц. При этом для каждого предложения можно добавить несколько вариантов перевода, если у вас не получается выбрать лучший.

    После регистрации у каждого участника появляется собственный профиль, в котором помимо персональных данных отображается информация о количестве переведенных предложений, рейтинге, переводимых курсах и результатах голосования других участников. Волонтеры смогут обсуждать переводы друг с другом прямо в процессе работы, а самые старательные будут получать виртуальные награды за свои достижения.

    Не менее важный этап — голосование за лучший вариант перевода. Голосовать можно прямо в редакторе перевода; также на сайте есть специальный виджет.

    Затем варианты перевода отправятся на утверждение эксперту и затем попадут в субтитры Coursera. В роли экспертов выступают преподаватели соответствующих специальностей российских вузов.

    Активность пользователей выражается в виде персонального рейтинга. На главной странице есть список лидеров проекта, в котором участники соревнуются за звание самого активного переводчика Coursera.
    лидеры
    Рейтинг складывается из следующих параметров:
    1. Количество добавляемых пользователем переводов;
    2. Количество голосов других участников, отданных за переводы этого пользователя;
    3. Количество голосов, отдаваемых пользователем за чужие переводы;
    4. Количество переводов пользователя, которые эксперт выбрал в качестве итоговых.
    Наибольший вклад в рейтинг дают параметры 2 и 4, поэтому выгодно переводить меньше, но лучше.

    Как было сказано выше, платформа имеет автоматизированную поддержку целостности терминологии. Для каждого из переводимых курсов предварительно составляется глоссарий: специальная программа анализирует лекции и выбирает часто встречающиеся слова. Полученный список терминов проверяют опытные редакторы ABBYY Language Services, «отсеивают» лишнее и переводят — так получается парный набор терминов на исходном языке и языке перевода. В рабочем интерфейсе переводчика система подсвечивает термины, показывает их перевод и позволяет подставить в поле для редактирования. Благодаря этому обеспечиваются единообразие и целостность перевода всего курса.

    В редакторе перевода есть специальная панель, в которой пользователи могут просматривать видеокурс, который переводят. Во-первых, это помогает лучше понять смысл текста; во-вторых, каждый участник проекта сразу видит, как его вариант перевода выглядит на видеофрагменте лекции: в момент редактирования пользователь в реальном времени наблюдает за изменением субтитров на видео и может вручную задавать места переносов строк субтитров. Таким образом, у участников есть возможность подбирать для перевода фразы, которые будут гармонично смотреться на экране. Кроме того, система позволяет быстро перемотать видео на тот фрагмент, который сейчас переводит пользователь, и наоборот — перейти к предложению, звучащему в данный момент. Для отображения видео мы взяли веб-плеер с открытым кодом. Он может проигрывать субтитры, которые принимает в виде .srt-файлов через API: SmartCAT динамически разбивает текст перевода на строки субтитров, генерирует из них .srt-файл и передает его плееру.
    редактор

    Мы очень хотели бы рассказать вам о подробностях разработки платформы, но наших специалистов пока отвлекать ну никак нельзя, так что чуть позже познакомим вас с другими техническими деталями. А пока присоединяйтесь к переводу Coursera! Все вопросы, пожелания и предложения присылайте на наш адрес: coursera@abbyy-ls.com или просто отставляйте здесь в комментариях. Подробнее о проекте, его миссии и Coursera вы узнаете из нашего блога.
    ABBYY 104,22
    Action information
    Поделиться публикацией
    Похожие публикации
    Комментарии 23
    • +4
      А когда будут доступны другие курсы для перевода? Я вижу только 8.
      • +1
        Добрый день!
        Пока доступны для перевода те курсы, которые мы отбирали специально для закрытого бета-тестирования. В ближайшее время мы начнем активно добавлять новые. Если вы хотите переводить определенный курс Coursera, сообщите, пожалуйста, нам на coursera@abbyy-ls.com.
      • +2
        — ( неактуально )
        • –4
          А зачем?
          • +8
            42
            • +15
              А если серьёзно, Coursera — один из самых популярных образовательных проектов, и они стремятся сделать образование доступным. Мы хотим поддержать эту миссию и дать людям, не владеющим английским языком, такие же возможности самообразования, как и тем, кто знает английский.
              • +2
                А всего-то нужен был 1 курс на русском — английский язык.
              • +7
                Нести свет образования важная и полезная миссия, не понимаю какие тут могут быть вопросы.
                • 0
                  Как зачем, это ж отличная демка SmartCAT и прочих продуктов!
                • +1
                  Сразу вспоминается приевшаяся максима про рыбу и удочку.
                  Параллельно можно было бы замутить что-то вроде платформы, на которой желающие могли бы изучить английский в достаточной мере, чтобы понимать лекции мировых университетов без перевода. Понимаю, что Москва не сразу строилась, да и многим проще посмотреть перевод, чем учить язык.
                  • 0
                    А в качестве проверочных работ — перевод фрагментов курсов.
                    • 0
                      Мы думаем, эти вещи не противоречат друг другу :)
                      Если человек совсем не знает английский, то он действительно выиграет больше от того, что начнет его изучать и тренироваться, скажем, на фрагментах курсов, как предложил Funcraft. А если же человек владеет английским, но его уровня недостаточно для того, чтобы сходу смотреть лекции в оригинале, то участие в подобном проекте по переводу поможет ему лучше освоить язык: он посмотрит, как другие переводят, сам подключится, узнает новые слова и выражения.
                      Тот случай, когда полезен и процесс, и результат :)
                    • +1
                      Планируются ли к переводу другие платформы, помимо Coursera?
                      • +1
                        Зачем распыляться на многие платформы? Как показывает практика, людские созидательные ресурсы ограничены, так что лучше сделать одно дело хорошо, и только затем приступить к следующему, чем везде продвинуться по чуть-чуть.
                        • 0
                          Если проект будет успешен, то да, мы рассматриваем возможность переводить другие платформы, причем как с иностранного на русский, так и наоборот. Но об этом пока рано говорить :)
                        • +2
                          мы вот здесь notabenoid.com/book/39843/ начинали переводить курс Human Computer Interaction прошлогодний. берите кому надо.

                          и было бы здорово чтобы информация об этом проекте была бы доступна на самом сайте Coursera. Потому что сами они использовали(-ют) другую платформу для переводов (Transifex кажется). Иначе, все желающие будут просто уходить туда.
                          • 0
                            На самой Coursera информация о проекте появится в ближайшее время.
                            Всё верно, Coursera активно локализуют свои курсы на множество языков, и пока в других странах они делают это на основе Transifex. Мы же сделали свою уникальную платформу, и проект очень поддерживает нашу инициативу, поэтому отдельно расскажет об этом своим пользователям.
                          • 0
                            А чем объясняется то, что на скрине 8 из топ-10 переводчиков — девушки? (Возможно, даже 9 из 10)
                            Или это традиционное для переводчиков распределение?
                            • 0
                              Ну девушек вообще больше, в том числе и в индустрии перевода :)
                              Судя по всему, они активнее подошли и к переводу Coursera.
                            • +1
                              Странно, что в основном интерфейсе редактирования («coursera.abbyy-ls.com/editor?document=581») нет средств фидбека по поводу интерфейса и его багов. Даже нет ссылки на coursera.abbyy-ls.com/ru#contacts, где сказано «шлите письмами», что, вроде бы, уже прошлый век, на фоне существования сервисов типа copiny.com/ и reformal.ru/.

                              Странно, что с красного логотипа SmartCAT в шапке нет ссылки на страницу продукта. Она прям туда так и просится!

                              Странно, что рядом нет меню доступа к учётке, оно есть лишь по кнопке «назад». Такое ощущение, что зайти в редактор — это как заглянуть в подсобочку, в модальное окошко, из которого прямо необходимо как можно быстрее выйти обратно в открытый мир списка курсов и лекций, с его нормальной полосой меню.

                              Странно, что на странице курса (http://coursera.abbyy-ls.com/Course/2c2d4e13-e797-42c2-9478-9a993b7da9f4) нет средства перевести название, вступление и названия лекций.

                              Странно, что даже когда все строки в левом списке заполнены русским тестом, при проигрывании видео показываются вперемешку русские и английские варианты. И нет видимой возможности расставить переносы в переводе и подправить тайм-коды, хотя тут написано, что «в момент редактирования пользователь в реальном времени наблюдает за изменением субтитров на видео и может вручную задавать места переносов строк субтитров. Таким образом, у участников есть возможность подбирать для перевода фразы, которые будут гармонично смотреться на экране.»

                              Много странного (
                              • +1
                                Странно, что в «словарь проверки орфографии» можно только добавлять строки, но нельзя их не удалять, ни редактировать. И непонятно, как они используются вообще. Да ещё заголовок у окошка словаря не переведён.

                                Странно смотрится заголовок колонки «Вариа...», когда нет ни всплывающей подсказки, ни возможности расширить колонку.

                                Странно, что нет возможности убрать свой плюс или минус к рейтингу вариантов перевода сегментов. И странно, что плюс туда иногда (непонятно, когда) ставится автоматически.

                                Странно, что список лекций coursera.abbyy-ls.com/Course/2c2d4e13-e797-42c2-9478-9a993b7da9f4 имеет порядковые номера, но они не соответствуют порядку лекций, обозначенному номерами в их названиях. В итоге, лекции расположены в очень странном порядке. — сначала седьмые, потом восьмые, потом пятые, вторые, третьи, четвёртые и первые — в конце. Что за бред?

                                Странно, что в списке лекций нет ни продолжительности видео лекции, ни количества в ней фрагментов к переводу. И нет сортировки вообще — ни по ним, ни по показателям прогресса.
                                • 0
                                  Очень хорошо, что список «переводы сегмента» сортируется по тексту и автору, и плохо — что не сортируется обратно по рейтингу.

                                  Жаль, что пробы, спам и бред там можно лишь минусовать, и нельзя удалить вовсе.

                                  Странно, что для выделенного слова нет встроенной возможность открыть словари lingvo.ru и multitran.ru

                                  Странно, что нет возможности пополнять память переводов и обсуждать получающиеся в ней варианты перевода словосочетаний.
                                  • 0
                                    Добрый день!
                                    Ох, спасибо за такие развернутые и дельные комментарии — передали нашим разработчикам :)
                                    Кстати, над частью из них мы уже активно работаем. Будем очень признательны, если вы продолжите делиться своими замечаниями здесь — coursera@abbyy-ls.com.

                                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                Самое читаемое