Выбирайте выражения, или Контролируемый язык

lang

Ирина Малышева, руководитель отдела переводов PROMT

Какой-такой язык?

Контролируемый язык активно используется для технического перевода, и в переводческом сообществе он обычно ассоциируется с профессиональным применением машинного перевода. Однако на самом деле это понятие гораздо шире и охватывает гораздо больше сторон жизни, чем можно было бы представить.

Идея контролируемого языка – то есть упрощенного с точки зрения лексики и грамматики естественного языка – стала активно развиваться в 20 веке.

Контролируемый язык изначально возник из практической необходимости (обучить аборигенов – http://en.wikipedia.org/wiki/Basic_English), потом был упрятан во вспомогательные процессы крупных высокотехнологичных компаний и лишь в последние десятилетия выплыл наружу – в связи с развитием систем автоматизированной работы с текстами и машинного перевода.

Существуют целые группы, занимающиеся разработкой контролируемых языков, и даже для русского создана своя версия «упрощенного технического языка».

Где его найти?

Если смотреть шире, оказывается, что все сталкиваются с контролируемым языком в повседневной жизни. Например, на работе (неужели вы не выбираете выражения, общаясь с несведущим клиентом или с высоким начальством?), когда просто смотрим телевизор на кухне, а диктор использует те или иные формулировки («бандформирование» или «группа повстанцев»?) и, наконец, когда обращаемся к детям (максимально простой язык).

Вопрос в том, какая степень контролируемости нужна в различных ситуациях и на каких уровнях языка она реализуется.

Как это работает?

Выбор слов

Как правило, понятие контролируемого языка прежде всего связывается с лексикой – ее упрощение дает наиболее очевидный эффект. Начинаем с того, что «такие слова использовать не надо» (так мы обычно различаем для себя формальный и неформальный стиль общения), заканчиваем принципом «одно слово – одно значение» (так пишется вся техническая документация, на этом принципе основано само понятие терминологии и технического текста).

Использование принципов контролируемого языка немедленно сказывается на качестве машинного перевода.

Например, разговорная фраза «Я щас форвардну его мыло» переведется так: «I щас форвардну its soap».

А то же самое в формальном стиле: «Я сейчас перешлю его письмо» будет переведено корректно: «I now will send his letter».

Эффект использования терминологии:

Предложение «Вставьте карту для загрузки карт в навигатор» переведется так: «Insert a card for loading of cards in the navigator». В переводе непонятно, о каких картах идет речь. Можно исправить фразу следующим образом: «Вставьте карту для загрузки географических карт в навигатор». И получим вменяемый перевод: «Insert a card for loading of maps in the navigator».

Построение фразы

Еще один часто используемый аспект контролируемости – синтаксические конструкции. Например, можно отказаться от излишнего числа придаточных предложений или вводных оборотов, не использовать слишком много местоимений либо просто следить за числом слов в предложении. Это удобный прием в том числе для тех, кто не очень силен в правильной расстановке знаков пунктуации или временах английского глагола. Контроль синтаксиса особенно широко применяется в учебном процессе: при изучении иностранных языков, подготовке учебных материалов и т. д.

Сравните переводы, сделанные при помощи Переводчика Google:

«Она не сохранилась в нем, так как их количество превысило заданный предел». Перевод: «She did not survive it, because their number exceeds a set limit».

Применяем принципы контролируемого языка и получаем адекватный перевод:

«Запись не сохранилась в журнале регистрации, так как количество записей превысило заданный предел» «Record was not kept in the log, since the number of entries exceeded the limit».

Следующий уровень использования принципов контролируемого языка – ограничения на уровне морфологии и даже фонетики.

Неизвестные науке слова

Ограничение морфологии относится к новым словам, образованным по существующим в языке моделям, но неизвестным словарям и системам перевода. Пример: такое простое и понятное слово, как «переклассифицируемый». Из-за низкого употребления в русских текстах Переводчик Google его не переводит вообще (PROMT переводит нормально). Но стоит заменить его на более частотное «повторно классифицируемый» – и с переводом будет все в порядке.

Звучание

Контроль языка на уровне фонетики нами применяется почти подсознательно. Мы стремимся избежать неблагозвучных сочетаний или труднопроизносимых слов (о необходимости этого нам постоянно напоминает в Word опция проверки звучания на стыке слов), либо намеренно замедляем речь, пытаясь донести до собеседника особо важную информацию.

Контроль фонетики выходит на передний план для любых систем распознавания или воспроизведения речи: хотите, чтобы вас поняли, – говорите медленно и внятно.

Что нам это дает?

Цель всех вышеперечисленных ограничений – сделать текст более удобным для восприятия «собеседником», будь то живой человек или система машинного перевода. Наибольший эффект от контроля языка достигается в системах машинного перевода, основанных на правилах (к этому классу относятся переводчики PROMT), но есть примеры того, как контролируемый язык улучшает качество статистического перевода (http://kv-emptypages.blogspot.com/2011/05/can-controlled-language-help-machine.html).

Пользователи Translate.Ru давно применяют правила контролируемого языка для улучшения своих переводов: самая простая инструкция выложена на сайте: http://www.translate.ru/Help.aspx/Tips.

  1. I now will send his letter… И это называется «корректно»? В школе по английскому языку какая оценка была? :) Второе место в английском предложении ВСЕГДА занято сказуемым. Единственное исключение составляет инверсия.
    Так что правильными вариантами будут I will now send his letter или I will send his letter now.

    • dhamin
      Сайт - http://mozgorilla.com/

      Автор статьи — Ирина Малышева, попробую её пригласить для комментария.

  2. ZaMo

    Блестящий совет!
    Говорите-пишите так, чтобы роботам было удобнее 😉

Добавить комментарий

Войти с помощью: 

Ваш e-mail не будет опубликован. Обязательные поля помечены *