Компания
31,67
рейтинг
27 февраля 2014 в 18:40

Разработка → «Нетворческая» сторона локализации. Проект глазами переводчика

(Окончание статьи от Марины Ильиных virtualtomato, старшего менеджера проектов в All Correct Localization)

Часть 2


В прошлый раз мы рассказывали о том, как наши менеджеры работают с файлами, которые попадают к нам на локализацию. Это статья оказалась для нас очень полезной, так как один из читателей показал нам отличный фильтр подгрузки, которым мы раньше мало пользовались. Надеюсь, в этот раз мы опять узнаем что-нибудь новенькое.

image


Когда проект подгружен, правильно обработан, а переводчики уже назначены на все документы, начинается самая главная работа, с которой очень часто и отождествляется локализация. Перевод.

Так почему же, даже отбросив в сторону технические удобства, переводить в программе memoQ лучше, чем без нее? Давайте разберемся.

Это окно работы с текстом. Тут работают переводчики и редакторы. Менеджеры тоже заглядывают сюда, чтобы проверить, все ли идет по плану.

image

Окно работы с текстом можно условно разделить на три части:

1)      Область перевода.

2)      Окно предварительного просмотра.

3)      Окно работы с базами и глоссариями.

Область перевода


Здесь, казалось бы, все просто: есть оригинальный текст, есть место для перевода. Самое интересное, что у каждой ячейки есть статус. Основные статусы:
  • Not translated (серый) — к переводу ячейки не приступали.
  • Edited (оранжевый) — с ячейкой работали, но перевод не завершен.
  • Pre-translated (голубой) — ячейка подставила из базы во время выполнения операции «Предперевод».
  • Confirmed (зеленый) — перевод ячейки завершен.


image

Это помогает переводчику более эффективно управлять своей работой. Возвращаться к ячейкам, над которыми он хотел бы еще подумать, отфильтровывать пустые ячейки, добавлять в базу готовый перевод.

Около каждой ячейки указана степень совпадения сегмента с ТМ в процентах. Обратите внимание на ячейки с цифрами 98 %, 99 %. Это означает, что исходный текст очень похож на текст, который ранее уже был переведен. Чаще всего отличие заключается в цифрах, тегах, знаках препинания. Здесь уже не нужно переводить заново, достаточно просто поправить имеющийся перевод в соответствии с данным исходным текстом. Чем ниже степень совпадения, тем сильнее текст отличается от сегмента, сохраненного в базе, и тем большая редактура ему требуется. Мы, как правило, считаем, что ячейки со степенью совпадения ниже 85 % уже не подлежат редактуре, так как по степени затраченных исполнителем усилий работа с такими сегментами ближе к переводу.

К каждой ячейке можно добавить комментарий. Очень удобно, что данные о том, какой пользователь добавил комментарий, сохраняются, и иногда там разворачиваются целые дискуссии.

Окно предварительного просмотра


Здесь переводчик видит, как выглядит исходный файл. Это особенно важно, если в файле было много графической информации, которая в memoQ не подгружается, но в окне предпросмотра ее прекрасно видно.

image

Окно работы с базами и глоссариями


Ну и наконец самое главное: работа с базами. В этом окне переводчик видит полные и частичные совпадения с Translation Memory (оранжевые сегменты) и совпадения с глоссарием проекта (темно-синие сегменты).

image

Для нашего демонстрационного файла я внесла в глоссарий три термина: Малютка, люм и название уровня Беги или сгори. На картинке ниже вы можете увидеть, что занесение термина в глоссарий, хоть дело и легкое, но требующее определенного навыка.

image

Мы знаем, что слово может употребляться в тексте в разных формах, в зависимости от числа, падежа, времени и уймы разных параметров. Поэтому при внесении термина в глоссарий мы обязательно добавляем технические символы:

* — заменяет любое количество символов (Teensie, Teensies)

| — отделяет изменяемую часть слова (Малютка, Малютки, Малюток…)

Второй важный аспект — это правила капитализации. Мы решили для себя, что Малютки у нас будут писаться с большой буквы, а люмы — с маленькой. Очень важно, однажды приняв это решение, всегда ему следовать, иначе в переводе будет неряшливая, неединообразная капитализация. Поэтому для русского языка мы ставим Case sensitivity — Yes, а для английского — No. Потому что мы знаем, что в исходном тексте бывают ошибки, а нам нужно, чтобы глоссарий всегда срабатывал. И на teensies, и на Teensies. Позже вы поймете, почему это важно.

К проекту можно подключать несколько глоссариев. Когда это может пригодиться? К игре FIFA 14 можно подключить глоссарий от FIFA 13, так как преемственность терминологии между играми в рамках одной франшизы — это важно. К проекту по переводу игры, скажем, на PlayStation 3 можно подключить глоссарий с терминологией PlayStation 3. Все это работает на качество локализации, а также делает труд переводчиков более приятным.

image

Auto QA


Представим, что мы наконец-то все перевели. И даже сделали Spell Check, о котором рассказывать нет особой нужды, так как он похож на проверку орфографии в Word. Теперь настало время автоматической проверки перевода. Чтобы было веселее, я внесла в наш перевод «немного» ошибок.

image

Ошибки:
  • Неверная капитализация слова «Малютка»
  • Неверный перевод цифрового значения в сегментах 2 и 5
  • Неверная капитализация слова «люм»
  • Двойной пробел в сегменте 7
  • Неверный перевод термина Run or Burn

А еще я добавила условие, что все строки должны быть не длиннее 35 символов.

Запускаем автопроверку и смотрим, что memoQ нам показывает.

image

Все ошибки найдены. Есть, правда, несколько невалидных предупреждений: программа не видит в переводе сегментов 1-3 цифры, поэтому думает, что есть ошибка, хотя в двух случаях из трех ее нет.

Что было бы если бы глоссарий был бы обработан не столь тщательно? Если бы мы не позаботились о капитализации и специальных символах? Было бы вот так:

image

Появилась бы одна лишняя невалидная ошибка, так как для memoQ термины «Малютка» и «Малюток» уже будут разными. А также вообще исчезли две ошибки с капитализацией слова «люм». И это проект всего лишь на восемь ячеек. На крупном проекте такое небрежное отношение к базам, приводит к огромному количеству ложных срабатываний Auto QA, а также к большому числу незамеченных мелких ошибок.

Эпилог


Переводить можно и на тетрадном листке. И, скорее всего, переводчик, который не ограничен во времени, бюджете и обладает всеми необходимыми навыками для выполнения задания, может довести перевод до совершенства и в таких условиях. Но когда тебе не нужно держать в голове все термины, когда ты знаешь, что мелкие помарки программа найдет сама и предложит тебе их исправить, когда в твоих руках куча дополнительного материала в виде глоссариев и баз, когда ничего не нужно переводить по два раза, тебе остается только расслабиться и делать то, с чем машина никогда не справится: отличный перевод.
Автор: @dhamin
All Correct Localization
рейтинг 31,67
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Комментарии (23)

  • +2
    Как круто организован процесс работы, впечатлен.
    • 0
      Спасибо! К сожалению, не всегда получается все идеально наладить с самого начала проекта. Но если получается, то проект проходит абсолютно безболезненно.
  • +1
    А почему не poedit?
    • 0
      MemoQ больше подходит для наших целей.
      • 0
        Чем? Я не сильно много работал с poedit'ом, но он, вроде бы, покрывает все сложные моменты при переводе.
        • +7
          poedit и MemoQ это как WordPad и MS Word — с виду похоже, но возможности отличаются в разы
          • 0
            я правильно понимаю, что memoQ — windows only?
            • 0
              Правильно. И пока, насколько я могу видеть (по MemoQ Yahoo Group), нет никакой надежды на то, что это изменится. MemoQ — коммерческий продукт для рынка, живущего на Windows. Рынок диктует свои законы.
    • 0
      Я могу ошибаться, но разве Poedit не работает только с PO?
  • +3
    Есть также подобный сервис Transifex. Для публичных проектов он бесплатен. К примеру, локализацией проекта bitbucket. Его удобство заключается еще и в том, что переводчики могут предложить сразу несколько переводов. Также сделан упор на то, что исполнителями может выступать сообщество проекта, а не только профессиональные переводчики.
    • +1
      Как же же долго я искал подобный сервис. Спасибо за ссылку.
    • 0
      Еще есть notabenoid, но он заточен на перевод субтитров и книг.
    • +2
      Я не пробовала Transifex. Судя по описанию неплохой инструмент по управлению переводом. Есть базовые функции абсолютно всех CAT-программ.

      Зато у меня был опыт работы в Webtranslateit. Над крупным заказом. Оплачиваемым. Тогда-то я и познала все круги ада. Если кому-то интересно, я могу написать обзор по нескольким подобным сервисам. Причем, я ни в коем случае не против crowdin или transifex. И даже не против webtranslateit. Но их функционал не справляется с многообразием наших проектов.

      • 0
        Да, обзор был бы очень интересен
        • +1
          Я сделал небольшой обзор нескольких сервисов локализации (правда, не с т.з. переводчика, к сожалению): habrahabr.ru/post/229031/
    • +3
      Сервисов и инструментов на самом деле ближе к 50 только в Европе. Большинство из них сочетают функционал памяти переводов и управления проектами.

      Профессиональные инструменты, созданные для переводческих компаний и специалистов, чаще всего десктопные. Три основных: MemoQ, Trados, Deja Vu, кроме них есть Wordfast, Across, MultiCorpora, ITranslate и другие. Примеры облачных инструментов (по возможностям они немного уступают): Wordbee, XTM, Memsource, ABBYY SmartCAT и другие. Добавим визуальную локализацию Alchemy Catalyst и Passolo, собственные инструменты Microsoft и других корпораций (1С Localizer?), стартапы типа PhraseApp и TranslateKarate сделанные разработчиками для разработчиков без понимания переводческого бизнеса, развитые платформы, ориентированные на краудсорсинг: Crowdin, Transifex, Gengo…

      Новые решения постоянно пишут, потому что разработчики приложений не всегда хорошо разбираются в этой каше. Например, у WhatsApp собственная платформа для крауд локализации на 67 языков, у Courserra — собственная на базе SmartCAT.

      Если копаться, выбор программ очень большой, и далеко не все из них совместимы между собой или просто удобны в использовании. Проще всего ориентироваться на бестселлеры типа memoQ.
  • 0
    Подтверждаю. MemoQ на сегодня лучшая TM tool среди существующих.
    Правда, именно для локализации ПО я бы смотрел в сторону Passolo. Это единственный продукт от SDL, который стоит своих денег.
    К сожалению, в переводческой среде стандартом считают SDL Studio (ранее Trados). Причина – агрессивная маркетинговая политика.
    Но все больше агентств переходит на MemoQ, и это не может не радовать. Плюс нельзя не отметить тот факт, что последняя замечательно может работать с «родными» форматами SDL.
    • 0
      К сожалению, в переводческой среде стандартом считают SDL Studio (ранее Trados). Причина – агрессивная маркетинговая политика.


      Причина в том, что лет 15 назад MemoQ, poedit и прочего еще не было. А Trados был.
      Т. е. исторически сложилось.
    • 0
      Passolo — да. Если бы ещё он был серверным, было бы вообще отлично.
    • 0
      Кроме Passolo я еще пробовала Alchemy CATALYST. Очень хорошая штучка. К сожалению, на реальном проекте не работала ни с одним инструментом. Хотя оба показались очень интересными.
    • 0
      Я бы не стал так категорично утверждать. У SDL Studio свои недостатки, у MemoQ свои. Не спорю, MemoQ более «продвинут», но в мою реальность приходят заказчики с SDL, иногда с Across, и еще никогда — с MemoQ.
      А еще мне совершенно не хочется оказаться в ситуации, когда сделанный в MemoQ Return Package почему-то откажется открываться у заказчика. Поэтому мы будем плакать, колоться, но продолжать жрать кактус SDL Studio просто потому, что так хочет заказчик.
      • +1
        кстати, у меня было такое. У заказчика с Trados Studio не открылся Return Package, сделанный в memoQ (я так и не понял, почему). Но решение оказалось простым — пакет можно переименовать в zip и достать оттуда sdlxliff, а затем просто переподложить в папку проекта (в нужный язык перевода).

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разработка