Обзор программы автоQA Verifika (Роман Миронов, Велиор)

mq1

Можно долго спорить по поводу того, насколько CAT-программы губительны для перевода. Кто-то скажет, что с их помощью бюро переводов режут ставки фрилансеров. Другой скажет, что они нарушают стилистическую связность текста, заставляя переводчика работать над разрозненными сегментами, не видя полной картины, в которую складывается переведенный текст. Но есть у них преимущество, оспорить которое нельзя. На выходе CAT-программы всегда двуязычный файл, который можно автоматически проверить на разнообразные типовые ошибки. Прежде всего это ошибки в цифрах, непереведенные слова и предложения, ошибки в тегах, непоследовательные переводы одинакового оригинала. Без двуязычного файла аналогичную проверку организовать сложно.

CAT-программы не только делают возможной такую проверку в принципе, но еще и имеют встроенные средства контроля качества (QA — Quality Assurance), которые позволяют проверять перевод на эти ошибки, «не отходя от кассы». Но пока еще в общей массе они неполноценны. Поэтому существует нишевая альтернатива: отдельные программы контроля качества. Среди них наиболее известными являются:

  • ApSIC Xbench 2.9
  • QA Distiller
  • ErrorSpy
  • CheckMate

В 2011 году их состав пополнился российской программой Verifika, выпускаемой бюро переводов Palex. Учитывая, что а) многих устраивают и встроенные в CAT-программы средства контроля качества и б) некоторые вышеперечисленные программы бесплатны (Xbench 2.9 и CheckMate), конкурировать в этом сегменте весьма непросто. Поэтому мне было очень интересно посмотреть, чем же собирается привлекать Verifika.

Общее впечатление

В целом Verifika не является прорывом, придумать что-то кардинально новое в этой области сложновато. Все основные типы ошибок, которые способен выявить компьютер, уже реализованы и есть почти во всех программах. Остается только улучшать недостатки конкурентов.

Интерфейс Verifika, на мой вкус, выглядит современно. Работать с ней в целом удобно и, пожалуй, приятнее, чем с такими программами, как Xbench 2.9 и QA Distiller 8.5, у которых интерфейс выглядит уже устаревшим. Поначалу может быть непривычно иметь дело с вкладками с разными типами ошибок вместо единого списка ошибок, как в вышеперечисленных программах, но привыкнуть к этому не составляет труда.

Список выявляемых ошибок. На мой взгляд, есть все, что нужно:

  • Непереведенные сегменты
  • Слова, которые не должны переводиться
  • Соблюдение базовых правил языка перевода
  • Форматирование текста
  • Повторяющиеся слова
  • Последовательность перевода
  • Термины
  • Орфография

Скриншот: типичные ошибки

Для некоторых типов ошибок, например пробелов у тегов, есть даже два разных способа поиска.

Работает Verifika сравнительно быстро, и нестрадает болезнью QA Distiller 8.5, который может надолго «задумываться» на больших файлах и списках терминов.

Список поддерживаемых форматов

  • SDL Trados® TRADOStag (.ttx)
  • SDL XLIFF (.sdlxliff)
  • memoQ (.xlf, .mqxliff, .mqxlz)
  • XLZ и XLIFF (Idiom и Lionbridge и др.)
  • TMX
  • WordFast TXML (.txml)
  • Двуязычные файлы MS Word (Trados, WordFast, Lionbridge)
  • Списки терминов в Excel (.xls, .xlsx) и текстовых файлах (.txt)
  • Passolo через сторонний конвертер
  • ITD (SDLX)

В этом плане Verifika превосходит, например, QA Distiller 8.5, в отличие от которого умеет работать с файлами TXML и двуязычными файлами Trados, переведенными в MS Word.

Функция автоматического исправления

По некоторым простым ошибкам Verifika умеет предлагать варианты исправления, например замену кавычек или десятичной точки на запятую. Для внесения предложенной автоматически правки нужно нажать Alt+A. Правка вносится непосредственно в проверяемый файл. Это очень удобно и экономит время, потому что не нужно переходить в CAT-программу, искать сегмент и править там. К сожалению, функция эта актуальна прежде всего для переводчика, потому что нередко тот, кто проверяет перевод с помощью Verifika уже после него, по разным причинам не может внести правки напрямую в файл.

Работа с тегами

Verifika умеет полноценно работать с тегами там, где QA Distiller 8.5, например, их не видит вообще. В частности, это позволяет выявлять пропущенные или лишние пробелы у тегов, как уже было сказано выше. Для локализации сайтов, софта и перевода прочих текстов, где имеются теги, эта функция нужна, как воздух.

Терминология в целом

Verifika может сохранить список терминов в профиль (набор настроек для конкретного проекта или типа проверки). Соответственно, при выборе профиля список загружается автоматически, добавлять его вручную при каждой проверке не нужно.

Поддерживаются списки терминов в формате TXT и XLS. Это тоже плюс по сравнению с QA Distiller 8.5, где приходится переделывать глоссарии во внутренний формат — DICT.

Терминология — параметр Whole words shorter than

Вот этот параметр уже можно назвать небольшим прорывом, поскольку идея очень удачная. Допустим, у меня в списке терминов есть термин:

east восток

По умолчанию программа найдет, например, «at least» и выдаст ошибку: в оригинале есть «east», но в переводе нет слова «восток». Чтобы этого избежать, нужно включить параметр «Слово целиком» для оригинала. Только при этом сразу возникает другая проблема: если в списке терминов есть, скажем, слово «bone screw», то программа будет проверять его только в этой словоформе, игнорируя «bone screws». Получается, нужно добавлять в список все словоформы оригинала, чтобы они не игнорировались. Это довольно трудоемкая работа.

Так вот параметр Whole words shorter than в Verifika позволяет эту работу значительно упросить. В примере выше достаточно установить для него значение 5. Слова в глоссарии короче 5 символов будут рассматриваться с применением параметра «Слово целиком». В результате «east» будет проверяться только как слово целиком, а вот «bone screw» будет уже проверяться и в составе других слов, в том числе «bone screws». Так что вводить словоформы оригинала в список придется только для тех терминов, которые короче установленного для параметра значения. Если в нашем случае мы хотим, чтобы проверялось не только «east», но еще и «eastern», то нужно добавить это слово в список отдельной строкой.

Проще говоря, с введением этого параметра сокращается количество словоформ оригинала, которые приходится вводить в список терминов, чтобы не пропускать их при проверке с параметром «Слово целиком».

Терминология — параметр «Слово целиком» для перевода

По замыслу разработчиков пользователь должен включить параметр «Слово целиком» для перевода. Допустим, в списке терминов имеем все тот же термин:

east восток

Поскольку каждое из следующих слов не совпадает с «восток», Verifika будет выдавать ошибку:

востоку, востока, востоке и т. д.

Каждый раз, когда Verifika находит такую ошибку, она пытается предложить пользователю добавить найденную словоформу во внутреннюю базу данных программы. То есть в этом примере я должен добавить словоформы «востоку», «востока» и «востоке» в БД. В результате в будущем Verifika уже будет знать, что «востоку», «востока» и «востоке» — это словоформы слова «восток» и не являются ошибками. То есть мы таким образом учим программу словоформам.

Идея хорошая, но у меня пока эффективно пользоваться этой функцией не получилось. QA Distiller 8.5, например обходится без словоформ, проверяя термины по основам. Ввели в список «вост», и он ищет строго «вост» в переводе, не обращая внимания на окончания. Получается, что там, где QA Distiller 8.5 вообще ничего не находит (и правильно делает), Verifika выдает большое количество ложноположительных ошибок и предлагает добавить все словоформы. Учитывая, что русский очень богат на словоформы, мне задача добавить все возможные варианты слов, чтобы при проверке был минимум ложноположительных ошибок, представляется очень и очень трудоемкой.

Стандартные настройки

Проверка орфографии

Порадовала возможность проверки орфографии одновременно с остальными типами проверок. Это удобно, причем опять же можно вносить правки непосредственно в файл. Для тех, у кого CAT -программа поддерживает пакетную проверку орфографии файлов, это вряд ли будет преимуществом. А вот те, у кого такой возможности нет, оценят ее по достоинству. Причем ведь бывает так, что правки вносятся в последний момент и еще раз проверить перевод встроенным средством после этого забывают. Но если взять в привычку выполнять перед сдачей файла заказчику хотя бы минимальный контроль качества в Verifika, что полезно и безотносительно орфографии, то программа об этих ошибках «напомнит».

Цена

Бюро переводов порадует наличие «плавающей» лицензии. Пользоваться такой программой нужно не с утра до вечера, а периодически, поэтому одной лицензии вполне хватит на трех-четырех человек. Цена лицензии — 135 евро. Относительно QA Distiller 8.5 и ErrorSpy — недорого.

Заключение

В целом Verifika очень порадовала, я даже испытываю гордость за Palex. Программа мощная, относительно недорогая и содержит ряд преимуществ перед конкурентами. Для себя я пока не решил, стоит ли использовать ее как основную программу для контроля качества. Хочу еще потестировать проверку терминологии. Надеюсь, что по мере увеличения базы данных со словоформами, количество ложноположительных ошибок сократится. И вот тогда уже точно можно будет со спокойной совестью переходить на Verifika.

А вы стали бы пользоваться платной программой вместо средства контроля качества, встроенного в вашу CAT-программу?

 

NB! Дополнение от редакции. В России проверочные программы, заточенные под русский язык также разрабатывают Janus WorldWide (доступна на бесплатной основе), ITI (в разработке), Star Spb (встроен в инструмент Transit) и, вероятно, другие технологичные переводческие компании.

 

Об авторе: Роман Миронов

Переводчик, редактор, владелец бюро переводов «Велиор». Профессионально занимается переводом с 2004 года. Автор блога http://www.velior.ru/blog/.

 

  1. Сергей

    Не соглашусь с тезисом о потери «стилистической связности» текста после перевода в CAT средстве. Никто не мешает смотреть на соседние сегменты и хотя бы бегло просмотреть текст до начала работы.
    А вот в чём принципиальная «прорывность» Verifika по сравнению с QA средствами самих CAT? То есть, зачем мне, работающему в, скажем, SDL Trados Studio 2011, отдельное QA средство?

  2. Юлия Макушина
    Сайт - http://e-verifika.com

    Роман, большое спасибо за подробный обзор Verifika! Конечно, Вы правы, что в этой области трудно изобрести что-то принципиально новое, так что остается только совершенствовать имеющееся. Мы пытались написать инструмент, который работает быстро и эффективно и, кроме того, имеет все так необходимые нам функции, которых не хватало в других программах. Судя по Вашему обзору и другим отзывам, это получилось :)
    Кроме того, именно обратная связь с пользователями помогает программе развиваться и дальше. Например, параметр Whole words shorter than, который Вам так понравился, предложен одним из наших первых пользователей, фрилансером по имени Johan Kjällman.
    Так что чем больше отзывов и конструктивной критики, тем эффективнее будет становиться Verifika :)

  3. Глеб
    Сайт - http://www.lepeshkin.ru

    Что-то скриншотов для обзора маловато. Я б еще видео предпочел посмотреть со стандартным workflow переводчика. Минут на 5.

  4. Andis

    I had to use this a couple of times. Was so angry… The files had many false mistakes, and the ignore button is of the size of a needle..

Добавить комментарий

Войти с помощью: 

Ваш e-mail не будет опубликован. Обязательные поля помечены *