Action information
283,67
рейтинг
25 марта 2014 в 15:29

Разное → «Переведем Coursera»: как сделать платформу для перевода лучших курсов мира на русский язык

24 марта ABBYY Language Services и центр Digital October объявили об официальном запуске краудсорсингового проекта «Переведем Coursera». Его цель — на волонтерской основе перевести лучшие курсы Coursera на русский язык и сделать их доступными для всех пользователей Рунета. Зарегистрироваться и приступить к переводу лекций можно уже сейчас на сайте проекта.

Пока мы разрабатывали и готовили к запуску этот проект, произошло много интересного. Мы решили массу организационных и технических задач, познакомились с большим количеством интересных людей, в том числе с яркой командой и основателями Coursera, а также с командой нашего локального партнера по этому проекту Digital October. Думаем, что вам будет интереснее узнать про технологии, поэтому сейчас расскажем, из чего состоит и что умеет платформа, которую мы разработали. Почти наверняка это не последний пост о проекте, так что пишите в комментариях, о чем еще вы бы хотели узнать.

Разработка началась в прошлом году, и до вчерашнего дня платформа находилась в стадии закрытого бета-тестирования, участие в котором приняли сотрудники ABBYY, Digital October, а также студенты и молодые специалисты Московского государственного университета, Российского государственного гуманитарного университета, Московского городского психолого-педагогического университета и других вузов. Благодаря комментариям первых переводчиков наши специалисты смогли доработать платформу, сделать ее более удобной и полностью подготовить к работе.

В основе ресурса лежит разрабатываемая ABBYY Language Services облачная платформа для автоматизации перевода SmartCAT. Как вы помните, эта система позволяет использовать в работе современные технологии переводческой индустрии: память переводов, автоматизированную поддержку целостности терминологии, машинный перевод. Все это собрано в удобном интерфейсе редактора, который устроен так, чтобы максимально повысить производительность пользователя. В «Переведем Coursera» эти профессиональные технологии доступны всем желающим — для «включения» в работу не потребуется специальная подготовка. Чтобы проект был интересен волонтерам, наши разработчики добавили в систему несколько дополнительных функций, о которых мы расскажем ниже.

Все желающие могут зарегистрироваться на сайте проекта, выбрать любой понравившийся курс и приступить к работе с ним. Тексты лекций поделены на предложения, временных рамок для перевода нет: только вы решаете, сколько времени потратить на участие — перевести 2–3 предложения или же 20 страниц. При этом для каждого предложения можно добавить несколько вариантов перевода, если у вас не получается выбрать лучший.

После регистрации у каждого участника появляется собственный профиль, в котором помимо персональных данных отображается информация о количестве переведенных предложений, рейтинге, переводимых курсах и результатах голосования других участников. Волонтеры смогут обсуждать переводы друг с другом прямо в процессе работы, а самые старательные будут получать виртуальные награды за свои достижения.

Не менее важный этап — голосование за лучший вариант перевода. Голосовать можно прямо в редакторе перевода; также на сайте есть специальный виджет.

Затем варианты перевода отправятся на утверждение эксперту и затем попадут в субтитры Coursera. В роли экспертов выступают преподаватели соответствующих специальностей российских вузов.

Активность пользователей выражается в виде персонального рейтинга. На главной странице есть список лидеров проекта, в котором участники соревнуются за звание самого активного переводчика Coursera.
лидеры
Рейтинг складывается из следующих параметров:
1. Количество добавляемых пользователем переводов;
2. Количество голосов других участников, отданных за переводы этого пользователя;
3. Количество голосов, отдаваемых пользователем за чужие переводы;
4. Количество переводов пользователя, которые эксперт выбрал в качестве итоговых.
Наибольший вклад в рейтинг дают параметры 2 и 4, поэтому выгодно переводить меньше, но лучше.

Как было сказано выше, платформа имеет автоматизированную поддержку целостности терминологии. Для каждого из переводимых курсов предварительно составляется глоссарий: специальная программа анализирует лекции и выбирает часто встречающиеся слова. Полученный список терминов проверяют опытные редакторы ABBYY Language Services, «отсеивают» лишнее и переводят — так получается парный набор терминов на исходном языке и языке перевода. В рабочем интерфейсе переводчика система подсвечивает термины, показывает их перевод и позволяет подставить в поле для редактирования. Благодаря этому обеспечиваются единообразие и целостность перевода всего курса.

В редакторе перевода есть специальная панель, в которой пользователи могут просматривать видеокурс, который переводят. Во-первых, это помогает лучше понять смысл текста; во-вторых, каждый участник проекта сразу видит, как его вариант перевода выглядит на видеофрагменте лекции: в момент редактирования пользователь в реальном времени наблюдает за изменением субтитров на видео и может вручную задавать места переносов строк субтитров. Таким образом, у участников есть возможность подбирать для перевода фразы, которые будут гармонично смотреться на экране. Кроме того, система позволяет быстро перемотать видео на тот фрагмент, который сейчас переводит пользователь, и наоборот — перейти к предложению, звучащему в данный момент. Для отображения видео мы взяли веб-плеер с открытым кодом. Он может проигрывать субтитры, которые принимает в виде .srt-файлов через API: SmartCAT динамически разбивает текст перевода на строки субтитров, генерирует из них .srt-файл и передает его плееру.
редактор

Мы очень хотели бы рассказать вам о подробностях разработки платформы, но наших специалистов пока отвлекать ну никак нельзя, так что чуть позже познакомим вас с другими техническими деталями. А пока присоединяйтесь к переводу Coursera! Все вопросы, пожелания и предложения присылайте на наш адрес: coursera@abbyy-ls.com или просто отставляйте здесь в комментариях. Подробнее о проекте, его миссии и Coursera вы узнаете из нашего блога.
Автор: @denisfrolov
ABBYY
рейтинг 283,67
Action information

Комментарии (23)

  • +4
    А когда будут доступны другие курсы для перевода? Я вижу только 8.
    • +1
      Добрый день!
      Пока доступны для перевода те курсы, которые мы отбирали специально для закрытого бета-тестирования. В ближайшее время мы начнем активно добавлять новые. Если вы хотите переводить определенный курс Coursera, сообщите, пожалуйста, нам на coursera@abbyy-ls.com.
  • +2
    — ( неактуально )
  • –4
    А зачем?
    • +8
      42
    • +15
      А если серьёзно, Coursera — один из самых популярных образовательных проектов, и они стремятся сделать образование доступным. Мы хотим поддержать эту миссию и дать людям, не владеющим английским языком, такие же возможности самообразования, как и тем, кто знает английский.
      • +2
        А всего-то нужен был 1 курс на русском — английский язык.
    • +7
      Нести свет образования важная и полезная миссия, не понимаю какие тут могут быть вопросы.
    • 0
      Как зачем, это ж отличная демка SmartCAT и прочих продуктов!
  • +1
    Сразу вспоминается приевшаяся максима про рыбу и удочку.
    Параллельно можно было бы замутить что-то вроде платформы, на которой желающие могли бы изучить английский в достаточной мере, чтобы понимать лекции мировых университетов без перевода. Понимаю, что Москва не сразу строилась, да и многим проще посмотреть перевод, чем учить язык.
    • 0
      А в качестве проверочных работ — перевод фрагментов курсов.
    • 0
      Мы думаем, эти вещи не противоречат друг другу :)
      Если человек совсем не знает английский, то он действительно выиграет больше от того, что начнет его изучать и тренироваться, скажем, на фрагментах курсов, как предложил Funcraft. А если же человек владеет английским, но его уровня недостаточно для того, чтобы сходу смотреть лекции в оригинале, то участие в подобном проекте по переводу поможет ему лучше освоить язык: он посмотрит, как другие переводят, сам подключится, узнает новые слова и выражения.
      Тот случай, когда полезен и процесс, и результат :)
  • +1
    Планируются ли к переводу другие платформы, помимо Coursera?
    • +1
      Зачем распыляться на многие платформы? Как показывает практика, людские созидательные ресурсы ограничены, так что лучше сделать одно дело хорошо, и только затем приступить к следующему, чем везде продвинуться по чуть-чуть.
    • 0
      Если проект будет успешен, то да, мы рассматриваем возможность переводить другие платформы, причем как с иностранного на русский, так и наоборот. Но об этом пока рано говорить :)
  • +2
    мы вот здесь notabenoid.com/book/39843/ начинали переводить курс Human Computer Interaction прошлогодний. берите кому надо.

    и было бы здорово чтобы информация об этом проекте была бы доступна на самом сайте Coursera. Потому что сами они использовали(-ют) другую платформу для переводов (Transifex кажется). Иначе, все желающие будут просто уходить туда.
    • 0
      На самой Coursera информация о проекте появится в ближайшее время.
      Всё верно, Coursera активно локализуют свои курсы на множество языков, и пока в других странах они делают это на основе Transifex. Мы же сделали свою уникальную платформу, и проект очень поддерживает нашу инициативу, поэтому отдельно расскажет об этом своим пользователям.
  • 0
    А чем объясняется то, что на скрине 8 из топ-10 переводчиков — девушки? (Возможно, даже 9 из 10)
    Или это традиционное для переводчиков распределение?
    • 0
      Ну девушек вообще больше, в том числе и в индустрии перевода :)
      Судя по всему, они активнее подошли и к переводу Coursera.
  • +1
    Странно, что в основном интерфейсе редактирования («coursera.abbyy-ls.com/editor?document=581») нет средств фидбека по поводу интерфейса и его багов. Даже нет ссылки на coursera.abbyy-ls.com/ru#contacts, где сказано «шлите письмами», что, вроде бы, уже прошлый век, на фоне существования сервисов типа copiny.com/ и reformal.ru/.

    Странно, что с красного логотипа SmartCAT в шапке нет ссылки на страницу продукта. Она прям туда так и просится!

    Странно, что рядом нет меню доступа к учётке, оно есть лишь по кнопке «назад». Такое ощущение, что зайти в редактор — это как заглянуть в подсобочку, в модальное окошко, из которого прямо необходимо как можно быстрее выйти обратно в открытый мир списка курсов и лекций, с его нормальной полосой меню.

    Странно, что на странице курса (http://coursera.abbyy-ls.com/Course/2c2d4e13-e797-42c2-9478-9a993b7da9f4) нет средства перевести название, вступление и названия лекций.

    Странно, что даже когда все строки в левом списке заполнены русским тестом, при проигрывании видео показываются вперемешку русские и английские варианты. И нет видимой возможности расставить переносы в переводе и подправить тайм-коды, хотя тут написано, что «в момент редактирования пользователь в реальном времени наблюдает за изменением субтитров на видео и может вручную задавать места переносов строк субтитров. Таким образом, у участников есть возможность подбирать для перевода фразы, которые будут гармонично смотреться на экране.»

    Много странного (
    • +1
      Странно, что в «словарь проверки орфографии» можно только добавлять строки, но нельзя их не удалять, ни редактировать. И непонятно, как они используются вообще. Да ещё заголовок у окошка словаря не переведён.

      Странно смотрится заголовок колонки «Вариа...», когда нет ни всплывающей подсказки, ни возможности расширить колонку.

      Странно, что нет возможности убрать свой плюс или минус к рейтингу вариантов перевода сегментов. И странно, что плюс туда иногда (непонятно, когда) ставится автоматически.

      Странно, что список лекций coursera.abbyy-ls.com/Course/2c2d4e13-e797-42c2-9478-9a993b7da9f4 имеет порядковые номера, но они не соответствуют порядку лекций, обозначенному номерами в их названиях. В итоге, лекции расположены в очень странном порядке. — сначала седьмые, потом восьмые, потом пятые, вторые, третьи, четвёртые и первые — в конце. Что за бред?

      Странно, что в списке лекций нет ни продолжительности видео лекции, ни количества в ней фрагментов к переводу. И нет сортировки вообще — ни по ним, ни по показателям прогресса.
    • 0
      Очень хорошо, что список «переводы сегмента» сортируется по тексту и автору, и плохо — что не сортируется обратно по рейтингу.

      Жаль, что пробы, спам и бред там можно лишь минусовать, и нельзя удалить вовсе.

      Странно, что для выделенного слова нет встроенной возможность открыть словари lingvo.ru и multitran.ru

      Странно, что нет возможности пополнять память переводов и обсуждать получающиеся в ней варианты перевода словосочетаний.
      • 0
        Добрый день!
        Ох, спасибо за такие развернутые и дельные комментарии — передали нашим разработчикам :)
        Кстати, над частью из них мы уже активно работаем. Будем очень признательны, если вы продолжите делиться своими замечаниями здесь — coursera@abbyy-ls.com.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разное