Сравнительно-историческое, типологическое и сопоставительное языкознание | Филологический аспект №02 (106) Февраль 2024
УДК 81.322.4
Дата публикации 29.02.2024
Особенности оформления текста при редактировании машинного перевода
Тархова Анна Борисовна
старший преподаватель кафедры теории и практики перевода, факультета Лингвистики Самарского университета государственного управления «Международного Института Рынка», г. Самара. abt1313@yandex.ru
Аннотация: Актуальность использования машинного перевода сегодня, безусловно, высока. Спрос на переводы больших объемов текста, развитие нейросетей и расширяющийся отечественный рынок, в совокупности с большим объемом экспорта и активным международным политическим, экономическим и научным сотрудничеством требуют современных и гибких решений. В статье рассматриваются вопросы выполнения, редактирования и форматирования текста после машинного перевода. Даются рекомендации по оформлению перевода с точки зрения синтаксиса, лексики, пунктуации. Рассматриваются частные сложности, такие как вопросы передачи дат, специальных символов, сложности.
Ключевые слова: МТ, машинный перевод, форматирование текста, правила, сложности с культурно-специфической лексикой.
Senior Lecturer, Chair of Translation Theory and Practice, Faculty of Linguistics, Samara University of Public Administration “International Market Institute”, Samara, Russia
Abstract: Today, the importance of using machine translation is undoubtedly high. The demand for translation of large amounts of text, the development of neural networks and the expanding domestic market, together with a large volume of exports and active international political, economic and scientific cooperation require modern and flexible solutions. The article deals with the issues of text execution, editing and formatting after machine translation. Recommendations are given on the formatting of the translation in terms of syntax, vocabulary, and punctuation. Complexities of capitalization, transfer of proper names, symbols, and culture-specific vocabulary are also considered.
Keywords: MT, machine translation, text formatting, rules, culture-specific vocabulary problems.
Тархова А.Б. Особенности оформления текста при редактировании машинного перевода // Филологический аспект: международный научно-практический журнал. 2024. № 02 (106). Режим доступа: https://scipress.ru/philology/articles/osobennosti-oformleniya-teksta-pri-redaktirovanii-mashinnogo-perevoda.html (Дата обращения: 29.02.2024)
Использование машинного перевода сегодня стало очень востребованной переводческой услугой. Благодаря развитию и обучению нейросетей в классификации переводческих профессий появились редакторы машинного перевода. Процесс редактуры выполненного машиной перевода называется РЕМТ или постредактирование машинного перевода. В процессе РЕМТ переводчик анализирует исходный текст, вносит необходимые правки и предлагает один или два варианта готового текста. Постредактирование текста отличается от редактирования тем, что в первом случае исходным текстом является перевод, выполненный машиной, а во втором – человеком. [1]. В работах преподавателей факультета лингвистики Самарского университета государственного управления «Международного Института Рынка» Л.В. Молчковой, С.Е. Шабалкиной, Н.А. Шевыриной, О.Ю. Коломийцевой часто затрагиваются различные грамматические [2;3] и лексические аспекты перевода [4;5;6]. А общие теоретические вопросы машинного перевода и практики его преподавания рассматривают наши коллеги из других университетов. В качестве примера можно привести труды Н.В. Нечаевой и С. Ю. Световой [7], а так же процитированного выше Н.А. Худякова [1].
Виды проектов
Тексты, предлагаемые на постредактуру, могут быть самыми разными: новостями, газетами, личными сообщениями или комментариями в социальных сетях, фрагментами из новостных программ, медицинскими публикациями, финансовыми и деловыми документами или относиться к спорту, путешествиям, торговле и т. д.
Некоторые проекты могут требовать одного перевода, в то время как для других понадобится два. В случае необходимости двух переводов, обязательными будут два перевода на основе одного и того же исходного текста и для всех фрагментов задания.
Если проект требует двух переводов, то оба перевода должны сохранять исходное намерение, используя разные слова, структуры и выражения (нельзя просто заменить слово синонимом, это должны быть действительно два разных способа выражения одного и того же).
Перевод 1 должен быть наиболее распространенным. Перевод 2 не должен состоять просто в изменении порядка слов или артиклей, использовании цифр вместо букв или сокращений и т. д. Вы должны выразить то же самое намерение исходного предложения иным образом, чем перевод 1.
Формат текста должен быть согласованным для исходного и целевого языков, если только целевой язык не имеет заранее определенного синтаксиса. Пример: перевод 1: Я – Ральф; перевод 2: Меня зовут Ральф.
Синонимы/различные значения/полисемия
В целевом языке слово может менять часть речи и/или иметь различные значения. При редактуре перевода используйте наиболее распространённое значение. Пример: Rat следует переводить: Грызун/Вредитель. Оба эти перевода соответствуют менее распространенному значению «предатель» вместо более распространенного значения «животное». В случае неоднозначности следует выбрать наиболее распространенный перевод или прибегнуть к генерализации. Пример: «America's Got Talent» (перевод с помощью устоявшегося эквивалента) «Америка ищет таланты», (с помощью генерализации) «телешоу». Не следует переводить это название как «В США есть таланты». При переводе необходимо опираться на контекст, использовать поиск в интернете, специализированные словари и системы контекстного поиска (например, Context Reverso).
Переводной текст не имеет смысла, отсутствует контекст/несвязанные предложения/неполные фрагменты
Если исходное значение слова/словосочетания/предложения понятно (несмотря на незначительные грамматические/орфографические/ стилистические ошибки), следует предложить свой вариант перевода (лучше буквальный) и оставить вопрос в специальной форме, либо дать обратную связь клиенту. Анализ, выполняемый редактором МТ, в данном случае включает в себя поиск максимального количества информации в поисковых системах для уточнения контекста. Если фрагмент, по мнению редактора, не полный, не стоит пытаться догадаться, чем именно заканчивается фраза, нужно максимально эквивалентно поправить предложенный фрагмент и задать вопрос. Если представленный фрагмент остался на языке оригинала (отличном от перевода), необходимости выполнять перевод такого отрывка нет, но обязательно нужно оставить вопрос в форме обратной связи с заказчиком. Есть вероятность, что текст оставлен на языке, отличном от оригинала намеренно (с целью создания особого колорита, в тексте присутствуют названия растений/животных на латыни и т.д.), однако так же это может быть следствием технической ошибки.
Ошибки в исходном тексте
Помимо непереведенных фрагментов, исходный текст может содержать орфографические или грамматические ошибки, сокращения, свойственные устной речи. При редактировании необходимо сохранить содержание, но исправить перевод таким образом, чтобы он не содержал языковых или грамматических ошибок. Также необходимо уточнять значения сокращений Пример: how r u' следует переводить: Как дела?
Рекомендации по стилю
В формате РЕМТ рекомендации по стилю включают такие аспекты, как уровень формальности, использование формул вежливости и разговорного языка. Если исходное предложение не предусматривает уровень формальности, его следует переводить в неформальном стиле.
Формулы вежливости/форма обращения/гендер
Вежливый/формальный язык можно использовать только в случаях, когда он более подходит для данного исходного предложения в конкретном контексте и предусмотрен жанрово-стилистическими характеристиками переводного текста. Например, в текстах инструкций необходимо опускать формулы вежливости. Пример: при переводе фразы Please, be extra careful when handling nano SIM-card следует опускать слово «please»: Будьте внимательны при эксплуатации нано сим-карты.
Если в исходном языке содержится местоимение, указывающее на гендер, число, необходимо использовать соответствующие формулировки в целевом языке. При выборе гендера необходимо ориентироваться на контекст и употребление местоимений, если пол выяснить не удается, выражение необходимо обезличить. Пример: I should twice think about it следует переводить: Мне следует дважды об этом подумать/Я подумаю об этом дважды, а не Я должен/должна дважды об этом подумать.
Разговорные выражения/слэнг/политически некорректные выражения/обсценная лексика
Если исходное предложение содержит ругательства, политически некорректные выражения, обсценную лексику, нужно руководствоваться тоном оригинала, ориентируясь на техническое задание и жанрово-стилистическую принадлежность. Например, при РЕМТ субтитров к фильмам машинный перевод часто включает грубые выражения, вплоть до мата. При редактуре, согласно законодательству РФ, необходимо «смягчать» выражения до литературной нормы. Пример: Fuck! следует переводить: Черт!/ Проклятье!
Коммерческие названия
Названия компаний и продуктов не должны переводиться, если только компания или продукт не используют другое название на целевом языке; капитализация не должна изменяться по сравнению с принятой для компании капитализацией, даже если принятая для компании капитализация нарушает обычные правила капитализации целевого языка. Пример: Skype остается Skype, а eBay остается eBay, но «Diet Coke» будет переводиться как «Coca-Cola Light» для тех стран, где безалкогольный напиток продается под этим названием.
Числа/даты/время/ единицы измерения
Форма числа, даты, названия валют должны соответствовать правилам переводящего языка. В случае записи числа цифрами, необходимо сохранять аналогичный формат. Пример: 123 оставить 123, а two plus two equals four следует переводить: два плюс два равно четыре. При передаче тысяч необходимо убирать знаки препинания и пробел. Пример: 123,000 следует переводить: 123000.
Формат день/месяц/год должен соответствовать нормам переводящего языка. Пример: 02/15/2015 следует переводить: 15/02/2015.
Время следует конвертировать согласно нормам, принятым в языке перевода. Пример: 4am PST следует переводить: 14.00 GMT+3 МСК.
Названия валют следует переводить полностью, либо использовать соответствующие аббревиатуры. Пример: 125 долларов США за ужин следует переводить: 125 долларов США / 125 долларов США.
При редактуре машинного перевода необходимо делать конвертацию в соответствующую языку метрическую систему Пример: 6 inches следует переводить: 15,24 см, а 75 Fahrenheit следует переводить: 25 градусов Цельсия.
Пунктуация/ специальные символы
При редактировании машинного перевода, важно придерживаться норм пунктуации переводящего языка. Сохраняются специальные символы: значки валют ($), упоминания и хэштеги (@, #). Несвойственные языку перевода знаки пунктуации меняются на соответствующие правилам пунктуации знаки целевого языка. В междометия добавляются дефисы. Пример: Hey!!! What are you doing there..? Agrh! следует переводить: Эй! Что ты там делаешь?! Ай-ай-ай!
В данной статье мы рассмотрели наиболее часто встречающиеся сложности при редактировании машинного перевода, а именно: частные случаи перевода дат, названий валют, коммерческих названий. Кроме того, мы уделили внимание стилистическим аспектам, вопросам перевода обесцененной лексики и формул вежливости. Коснулись пунктуации и специальных символов, а так же привели примеры решения задач с полисемией и выхода из ситуаций, когда текст совершенно не имеет смысла. Однако затронуты были далеко не все аспекты и вопросы данного вида переводческой деятельности. Основные рекомендации для редактора машинного перевода: ориентироваться на техническое задание клиента, правила и нормы переводящего языка и консультироваться с заказчиком по вопросам, которые выходят за рамки его компетенции.
Список литературы
1. Худяков, Н. А. Постредактирование машинного перевода: теоретические аспекты / Н. А. Худяков // Филологический аспект. – 2019. – № 1(45). – С. 232-239.
2. Коломийцева, О. Ю. Способы реализации категории полимодальности в англоязычном Инстаграм-дискурсе / О. Ю. Коломийцева, А. Н. Москалева // Вестник Международного института рынка. – 2021. – № 2. – С. 115-125.
3. Шабалкина, С. Е. Текстообразующая функция прилагательных RED, BLUE, WHITE в семантическом пространстве текстов англоязычной прозы / С. Е. Шабалкина, Н. А. Шевырина // Вестник Международного института рынка. – 2022. – № 1. – С. 129-136.
4. Григорьева, Д. В. Лексико-семантические поля в рекламных слоганах Coca-Cola и Pepsi / Д. В. Григорьева, Л. В. Молчкова // Вестник Международного института рынка. – 2022. – № 1. – С. 113-117
5. Молчкова, Л. В. Тематическое поле наименований молодежных субкультур: структура, семантика, перевод / Л. В. Молчкова, С. Е. Шабалкина, Н. А. Шевырина // Теория языка и межкультурная коммуникация. – 2019. – № 4(35). – С. 164-173.
6. Шабалкина, С. Е. Синтаксические функции имен действия / С. Е. Шабалкина, Н. А. Шевырина // Вестник Международного института рынка. – 2021. – № 2. – С. 148-153.
7. Нечаева Наталья Викторовна, Светова Светлана Юрьевна Постредактирование машинного перевода как актуальное направление подготовки переводчиков в вузах // Вопросы методики преподавания в вузе. – 2018. – №25. [Электронный ресурс] URL: https://cyberleninka.ru/article/n/postredaktirovanie-mashinnogo-perevoda-kak-aktualnoe-napravlenie-podgotovki-perevodchikov-v-vuzah (дата обращения: 17.04.2023).