Пойми меня, программа-переводчик!

19

Специалисты Translate.ru советуют: как правильно составлять текст для машинного перевода

Как правильно составлять текст для машинного перевода Как правильно составлять текст для машинного перевода Контролируемый язык активно используется для технического перевода, и в переводческом сообществе он обычно ассоциируется с профессиональным применением машинного перевода. Однако на самом деле это понятие гораздо шире и охватывает гораздо больше сторон жизни, чем можно было бы представить.

Идея контролируемого языка – то есть упрощенного с точки зрения лексики и грамматики естественного языка – стала активно развиваться в 20 веке.

Контролируемый язык изначально возник из практической необходимости (обучить аборигенов), потом был упрятан во вспомогательные процессы крупных высокотехнологичных компаний и лишь в последние десятилетия выплыл наружу – в связи с развитием систем автоматизированной работы с текстами и машинного перевода.

Существуют целые группы, занимающиеся разработкой контролируемых языков, и даже для русского создана своя версия «упрощенного технического языка».

Если смотреть шире, оказывается, что все сталкиваются с контролируемым языком в повседневной жизни. Например, на работе (неужели вы не выбираете выражения, общаясь с несведущим клиентом или с высоким начальством?), когда просто смотрим телевизор на кухне, а диктор использует те или иные формулировки («бандформирование» или «группа повстанцев»?) и, наконец, когда обращаемся к детям (максимально простой язык).

Вопрос в том, какая степень контролируемости нужна в различных ситуациях и на каких уровнях языка она реализуется.

Выбор слов

Как правило, понятие контролируемого языка прежде всего связывается с лексикой – ее упрощение дает наиболее очевидный эффект. Начинаем с того, что «такие слова использовать не надо» (так мы обычно различаем для себя формальный и неформальный стиль общения), заканчиваем принципом «одно слово – одно значение» (так пишется вся техническая документация, на этом принципе основано само понятие терминологии и технического текста).

Использование принципов контролируемого языка немедленно сказывается на качестве машинного перевода.

Например, разговорная фраза «Я щас форвардну его мыло» переведется так: «I щас форвардну its soap».

А то же самое в формальном стиле: «Я сейчас перешлю его письмо» будет переведено корректно: «I now will send his letter».

Эффект использования терминологии: Предложение «Вставьте карту для загрузки карт в навигатор» переведется так: «Insert a card for loading of cards in the navigator». В переводе непонятно, о каких картах идет речь. Можно исправить фразу следующим образом: «Вставьте карту для загрузки географических карт в навигатор». И получим вменяемый перевод: «Insert a card for loading of maps in the navigator».

Построение фразы

Еще один часто используемый аспект контролируемости – синтаксические конструкции. Например, можно отказаться от излишнего числа придаточных предложений или вводных оборотов, не использовать слишком много местоимений либо просто следить за числом слов в предложении. Это удобный прием в том числе для тех, кто не очень силен в правильной расстановке знаков пунктуации или временах английского глагола. Контроль синтаксиса особенно широко применяется в учебном процессе: при изучении иностранных языков, подготовке учебных материалов и т. д.

Сравните переводы, сделанные при помощи Переводчика Google: «Она не сохранилась в нем, так как их количество превысило заданный предел». Перевод: «She did not survive it, because their number exceeds a set limit».

Применяем принципы контролируемого языка и получаем адекватный перевод: «Запись не сохранилась в журнале регистрации, так как количество записей превысило заданный предел» – «Record was not kept in the log, since the number of entries exceeded the limit».

Следующий уровень использования принципов контролируемого языка – ограничения на уровне морфологии и даже фонетики.

Неизвестные науке слова

Ограничение морфологии относится к новым словам, образованным по существующим в языке моделям, но неизвестным словарям и системам перевода. Пример: такое простое и понятное слово, как «переклассифицируемый». Из-за низкого употребления в русских текстах Переводчик Google его не переводит вообще (PROMT переводит нормально).

Но стоит заменить его на более частотное «повторно классифицируемый» – и с переводом будет все в порядке.

Звучание

Контроль языка на уровне фонетики нами применяется почти подсознательно. Мы стремимся избежать неблагозвучных сочетаний или труднопроизносимых слов (о необходимости этого нам постоянно напоминает в Word опция проверки звучания на стыке слов), либо намеренно замедляем речь, пытаясь донести до собеседника особо важную информацию.

Контроль фонетики выходит на передний план для любых систем распознавания или воспроизведения речи: хотите, чтобы вас поняли, – говорите медленно и внятно.

Что это дает?

Цель всех вышеперечисленных ограничений – сделать текст более удобным для восприятия «собеседником», будь то живой человек или система машинного перевода. Наибольший эффект от контроля языка достигается в системах машинного перевода, основанных на правилах (к этому классу относятся переводчики PROMT), но есть примеры того, как контролируемый язык улучшает качество статистического перевода (на английском языке).

ПОДЕЛИТЬСЯ


Предыдущая статьяАнтивирус Касперского 2011 получает высший балл за обнаружение неизвестных ранее угроз
Следующая статьяeSport Universe: новый киберспортивный проект от ASUS
КОММЕНТАРИИ



Загрузка...