Удлинение текста при переводе

Автор блога Angel Station проводит интересное мини-исследование на тему, которую можно условно обозначить как «удлинение текста  программ с англоязычным интерфейсом в локализациях на других языках».

Он взял базу переводов, около 100 тысяч фраз и компьютерных терминов, написал программку, которая выцепляет и анализирует пары “английский оригинал – перевод” для шести языков: французский, итальянский, немецкий, испанский, русский, португальский (бразильский).

Первоначально автор выбрал три параметра:

  • У какого из вышеперечисленных языков встретился перевод с максимальным удлинением? Пример: “ Cannot Find Help File” на итальянский переводится как “Impossibile trovare il file della Guida”, удлинение 81%. А “User” на русский переводится как “Пользователь”, удлинение – 200%. И так далее. У какого языка встретится самый большой процент?
  • У какого из вышеперечисленных языков самое большое “среднее” удлинение текста по всей выборке? Все языки действительно “в среднем” длиннее английского, какой “самый удлиняющийся”?
  • У какого из языков получилось наибольшее количество переводов, где длина оригинала больше длины перевода? Ну, типа “Connection Attributes” на одну букву длиннее, чем “Атрибуты соединения”… В каком языке чаще всего встречаются такие “короткие” переводы?

Ответы на вопросы получились следующими:

  1. Русский.
  2. Французский.
  3. Русский.

Top 3 “удлиненных” терминов выглядят так:

Русский:

XP -> Расширенная хранимая процедура (удлинение 1400%)
KPI -> Ключевой индикатор производительности (1133%)
3D -> Объемные эффекты (700%)

Итальянский:

SQL -> Agente log shipping Microsoft SQL Server (1233%)
UDF -> Funzione definita dall’utente (866%)
SCD -> Dimensione a modifica lenta (800%)

2. У какого из вышеперечисленных языков самое большое “среднее” удлинение текста по всей выборке?

Французский. На втором – немецкий. Русский попал на последнее место по простой причине: у него оказалось максимальное количество переводов, длина которых короче оригинала (см. п. 3). Результаты получились такими:
Fre – 23%
Ger – 21.7%
Spa – 20%
Ita – 18%
BrP – 13.7%
Rus – 13.1%

3. У какого из языков получилось наибольшее количество переводов, где длина оригинала больше длины перевода?

Русский. Сводка:
Rus – 22%
BrP – 15%
Ita – 11.5%
Ger – 10%
Spa – 9.7%
Fre – 8.2%

В качестве бонуса подкину вот какие данные: французский же попал на первое место по проценту переводов, длина которых превышает оригинал больше, чем на 40%. Для меня 40% всегда было “магическим” числом: многие клиенты требуют, чтобы при переводе софта длина переведенных терминов не превышала эту цифру: в пользовательском интерфейсе разработчики оставляют под “удлинение” примерно столько места. Оказывается, что в среднем каждый пятый перевод превышает этот предел.

Более подробно, с диаграммой и примерами — в блоге автора.

Добавить комментарий

Войти с помощью: 

Ваш e-mail не будет опубликован. Обязательные поля помечены *