Германские языки | Филологический аспект №05 (85) Май 2022

УДК 82.322.4

Дата публикации 16.05.2022

Постредактирование текстов автоматизированного и машинного перевода

Бакиева Дженнет Нурягдыевна
магистрант кафедры языкознания и переводоведения, Московский городской педагогический университет, РФ, г. Москва, jennet.bakieva@mail.ru

Аннотация: Настоящее исследование посвящено анализу качества перевода массмедиальных текстов, полученных с помощью программ автоматизированного и машинного перевода. На материале переводов новостных сводок и статей BBC News и the Guardian с английского языка на русский при помощи ПО SmartCAT в качестве результата исследования описывается определенный алгоритм исправления ошибок, совершаемых машинным переводом, для дальнейшего эффективного процесса постредактирования.
Ключевые слова: постредактирование, автоматизированный перевод, машинный перевод, переводческие ошибки, переводческие трансформации

Postediting of texts of computer-aided and machine translation

Bakieva Jennet Nuryagdyevna
Masters Student of Language and Translation Studies Department, Moscow City Teachers’ Training University, Russia, Moscow

Abstract: The paper focuses on the analysis of mass media texts attained with computer-aided and machine translation programmes. The author provides with an algorithm to correct mistakes based on translation errors made by the computer-aided translation software SmartCAT supported by examples of BBC News and the Guardian reports translated from English into Russian. This algorithm is aimed at making the postediting process more efficient.
Keywords: postediting, computer-aided translation, machine translation, translation errors, translation transformations

Правильная ссылка на статью
Бакиева Д.Н. Постредактирование текстов автоматизированного и машинного перевода // Филологический аспект: международный научно-практический журнал. 2022. № 05 (85). Режим доступа: https://scipress.ru/philology/articles/postredaktirovanie-tekstov-avtomatizirovannogo-i-mashinnogo-perevoda.html (Дата обращения: 16.05.2022 г.)

В современном мире ввиду ускорения многих процессов, в том числе перевода, предлагаются эффективные пути сокращения затрат времени и ресурсов на многие задачи. Так, программы машинного и автоматизированного перевода в настоящее время обеспечили значительное повышение производительности и качества и ускорили процесс перевода. Машинный перевод (сокращенно МП) принято определять как процесс перевода при помощи высоких технологий, который производится по алгоритму, заданному определенными правилами [1]. В то время как автоматизированный перевод (сокращенно АП), в отличие от машинного, выполняется при помощи человека, который может задать процесс перевода с применением глоссариев или ручной правкой текста [2, с. 144].

Компании, которые начали использовать МП и АП в качестве конкурентного преимущества для снижения затрат и предложения более выгодной стоимости услуг, постепенно теряли преимущество. Неумолимые требования рынка можно рассматривать как один из факторов, вернувших идею использования МП и АП в качестве инструмента повышения производительности, чем предопределяется актуальность исследования программ МП и АП. Поставщики языковых услуг (далее ПЯУ) были вынуждены снижать цены, спрос на перевод быстро рос, и МП логично начали пересматривать как возможное эффективное использование ресурсов. Все системы машинного перевода предлагают непревзойденную скорость, технологический прогресс значительно снизил затраты, а качество всегда было непробиваемым понятием в переводоведении [3, с. 135].

Как уже было отмечено выше, тексты, полученные в ходе машинного перевода, чаще не соответствуют адекватному восприятию текста, поэтому тексты требуют постредактирования. Постредактирование как термин в свою очередь принято определять как процесс исправления, корректировки и редактирования текста, полученного в программе машинного перевода, с исходного языка на язык перевода [4]. Иными словами, постредактирование является исправлением уже имеющегося текста, нежели полный перевод с нуля [5].

Результатом перевода программы АП должен быть текст, который вызывает ту же реакцию реципиента на переведенный текст, что и отправителя в тексте оригинала, а также стилистически соответствует исходному тесту [6, с. 51]. Для достижения адекватного восприятия текста переводчик прибегает к переводческой трансформации. Следует отметить, что многие исследователи по-разному классифицируют виды переводческой трансформации. Так, согласно теории Л. С. Бархударова, трансформации предполагают «качественно разнообразные преобразования, необходимые для достижения переводческой эквивалентности («адекватности») перевода вопреки расхождениям в формальных и семантических системах двух языков» [7, с. 152].

В переводоведении различают три основных вида переводческих трансформаций: лексические, грамматические и стилистические. Данная классификация представляется релевантной и при постредактировании текстов, полученных в ходе машинного перевода.

Л. К. Латышев определяет лексические трансформации как «отклонение от словарных соответствий» [8, с. 193]. Множество причин существуют для объяснения лексических трансформаций, охватить которые в полной мере не является возможным. Однако, следует отметить, что семантика слов в разных языках довольно обширна, что и создает особую переводческую трудность для системы машинного перевода, которая не всегда способна распознать нужную семантику слова, подходящую для того или иного контекста. Толковые словари выдают лишь описательные значения слов в нестрогой форме, что никак неприменимо в машинном переводе [9, с. 9].

Причины грамматических трансформаций охватывают как лексические особенности языка, так и основные грамматические факторы, иными словами различие в грамматическом строе двух языков. Различие принципов грамматического строя отражается в расхождениях между грамматическими свойствами. Например, в английском языке соблюдается лаконичность слов и предложений, в то время как в русском языке подобных ограничений нет.

Стилистическими преобразованиями называется намеренное изменение «образной структуры текста, либо его лексического наполнения с целью достижения коммуникативно-функциональной и художественно-эстетической адекватности ИТ и ПТ или утрата эмоционально-оценочных либо образно-стилистических характеристик языковых единиц ИТ при выборе переводческих соответствий» [10, с. 189].

Так, в ходе исследования выходного текста с помощью МП программы SmartCAT были выработаны этапы проведения постредактирования, применимые для любых текстов, полученных с помощью МП. В качестве материала исследования были взяты тексты новостных статей BBC News и the Guardian за 2020, 2021 и 2022 годы.

Первым этапом работы с текстами машинного перевода является предпереводческий анализ текста. Стоит отметить, что предпереводческий анализ текста подразделяется на две стадии: само понимание текста и его последующий предпереводческий анализ [11, с. 16]. Сам процесс анализа начинается с оценки культурно-значимых факторов – различных представлений метафорических выражений, имен собственных, «видов вариативности в языке, связанных с неоднородностью и многогранностью общественной жизни, существованием социальных, профессиональных и многих других различий между людьми в рамках одной и той же культуры в английском и русском языках» [12, с. 108]. В отношении текстов машинного перевода это особенно актуально, поскольку машина не способна самостоятельно определить какие-либо культурологические особенности текста, в связи с чем возникает большинство ошибок перевода.

Рассмотрим пример:

 

Таблица 1. Текст 1

Оригинал

МП

Постредактирование

The WTA has remained firm throughout the incident, requesting to speak with Peng themselves.

WTA оставалась твердой на протяжении всего инцидента, прося поговорить с самим Пенгом.

Женская теннисная ассоциация придерживается твердой позиции, требуя самостоятельно поговорить с Пэн.

В данном предложении было исправлено имя собственное (Пэн), поскольку система МП программы SmartCAT применила транслитерацию китайского имени, написанного на латинице, тогда как общепринятый вариант имени происходит от транскрипции. Представляется необходимым отметить, что при упоминании полного имени Пэн Шуай (Peng Shuai) система МП смогла его распознать и представить адекватный перевод, тогда как фамилия программой транслитерируется.

Помимо этого, была произведена лексическая трансформация в отношении аббревиатуры и ее расшифровки WTA – Женская теннисная организация, поскольку данная аббревиатура может быть незнакома читателю новостной статьи ввиду ограниченности ее только использования в рамках определенной сферы, а именно, спортивной.

Подобная ошибка встречается довольно частотно: в зависимости от контекста система МП распознает какие-либо культурно-значимые факторы по-разному. Например:

The Halix plant in the Netherlands hasn't yet received an EU licence… – Завод Halix в Нидерландах еще не получил лицензию ЕС…

В данном случае система МП программы SmartCAT применила общепринятое название завода, производящего вакцину AstraZeneca, однако уже в следующем предложении система предлагает вариант перевода в виде транслитерации:

Таблица 2. Текст 2

Оригинал

МП

Постредактирование

“If we are to find a solution over the Halix plant, it will have to involve reciprocity”.

«Если мы хотим найти решение по поводу завода в Галиксе, оно должно быть взаимным»

«Если мы хотим найти решение по поводу завода Halix, оно должно быть принято обоюдно».

Поскольку общепринятым вариантом употребления названия фармацевтической компании является англоязычный, то название не получает перевода на русский перевод. Помимо этого, программой МП была допущена стилистическая ошибка взаимное решение, которое для носителя русского языка является стилистически некорректным. В связи с этим в процессе постредактирования данное словосочетание получило более развернутый перевод оно [решение] должно быть принято обоюдно.

Вторым этапом работы является исправление смысловых ошибок, искажающих исходную предметную ситуацию текста.

Таблица 3. Текст 3

Оригинал

МП

Постредактирование

Chinese tennis star Peng Shuai has publicly accused a retired Communist official of sexual assault.

Звезда китайского тенниса Пэн Шуай публично обвинил отставного коммунистического чиновника в сексуальном насилии.

Звезда тенниса из Китая Пэн Шуай публично обвинила отставного коммунистического чиновника в сексуальном насилии.

В данном примере система МП распознала имя китайской теннисистки как мужское, соответственно, исказился смысл повествования. При следующих упоминаниях теннисистки применялась приставка Ms, и система, что весьма очевидно, не допускала в этом случае ошибок. Смысловая ошибка возникала только при упоминании имени без каких-либо приставок и пояснений, например Peng, 35, is a prominent figure in Chinese tennis программа перевела как 35-летний Пэн – выдающаяся фигура в китайском теннисе.

Третьим этапом является постредактирование грамматических ошибок, совершаемых программой АП. Ср.:

Таблица 4. Текст 4

Оригинал

МП

Постредактирование

Peng has a strong social media presence, with half a million followers on Weibo, the Chinese equivalent of Twitter.

Пэн имеет сильное присутствие в социальных сетях, с полумиллионом подписчиков на Weibo, китайском эквиваленте Twitter.

Пэн довольно известна в социальных сетях, у нее полмиллиона подписчиков на Weibo, китайском аналоге Twitter.

Вариант, предложенный программой АП, является дословным и не соответствует адекватному переводу. В связи с этим в процессе постредактирования были применены грамматические преобразования для достижения адекватного восприятия текста. Фраза имеет сильное присутствие в социальных сетях стилистически не соответствует нормам русского языка и является буквальным переводом с английского языка, которая для носителя русского не имеет смысла. Соответственно при постредактировании данная фраза была переведена как довольно известна в социальных сетях, так как данный вариант является более устойчивым в русском языке и подходящим для контекста новостной статьи, а также более понятным для получателя информации.

Рассмотрим другой пример:

Таблица 5. Текст 5

Оригинал

МП

Постредактирование

At the more glamorous end of aviation, there is still no shortage of applicants: BA is holding wings ceremonies, where newly qualified cabin crew are given their silver winged badges, almost daily.

В более гламурном сегменте авиации по-прежнему нет недостатка в кандидатах: бакалавриат проводит церемонии wings, на которых новым квалифицированным бортпроводникам почти ежедневно вручаются значки с серебряными крыльями.

В более представительной сфере авиации по-прежнему нет недостатка в кандидатах: авиакомпания British Airways проводит церемонии награждения выпускников авиашколы, в ходе которых новым квалифицированным бортпроводникам почти ежедневно вручаются значки с серебряными крыльями.

В данном отрывке из новостной статьи the Guardian системой МП программы SmartCAT были допущены две ошибки – смысловая и грамматическая. Смысловая ошибка заключается в переводе аббревиатуры ВА, которая в выходном тексте МП имеет вариант бакалавриат. Аббревиатуры являются особой переводческой сложностью для системы МП, которая не всегда может распознать подходящий для перевода вариант. Новостная статья фокусируется на проблемах нехватки рабочего штата в авиакомпаниях в связи с коронавирусной пандемией, и в данном случае аббревиатура BA происходит от названия компании British Airways. Таким образом, в процессе постредактирования слово бакалавриат было заменено на название британской авиакомпании. Помимо смысловой ошибки была допущена ошибка грамматическая, так как система МП не перевела слово wings, более того, не распознала словосочетание, в котором данное слово использовалось, а именно wings ceremony. Данную ошибку также можно отнести к неспособности системы МП распознавать культурологические особенности, поскольку wings сeremony обозначает церемонию награждения выпускников по окончании обучения работе в авиации в роли бортпроводников. Данные церемонии проводятся теми авиакомпаниями, которые курировали обучение будущего штата, и подобный феномен в числе российских авиакомпаний не наблюдается.

Таким образом, выходной текст, полученный в ходе машинного перевода и имеющий ошибки на разных уровнях языка, преобразуется с применением переводческих трансформаций в процессе постредактирования текста, которые позволяют избежать проблемы буквализма при переводе, препятствующего созданию в семантическом и структурном содержании адекватного эквивалента в исходном языке. На основании исследованных переводческих трансформаций, проделанных в ходе постредактирования, представляется необходимым отметить, что программы МП на настоящий момент не способна распознавать сложные предметные ситуации, учитывать культурологическую специфику при переводе языковых явлений. Представленные переводы с учетом всех редактирований были получены в ходе переводческих трансформаций (лексических, грамматических и стилистических), что помогает выявить наиболее релевантный подход к редактированию публицистических текстов, основанных на новостных статьях BBC News и the Guardian.


Список литературы

1. Официальный сайт компании ПРОМТ [Электронный ресурс]. – URL: http://www.promt.ru/, свободный.
2. Bowker L. Computer-aided Translation Technology / L. Bowker. – Ottawa: University of Ottawa Press, 2002. – 144 p.
3. Screen B. Productivity and quality when editing machine translation and translation memory outputs: an empirical analysis of English to Welsh translation // Studia Celtica Posnaniensia. – 2017. – Vol 2 (1). – P. 119-138.
4. Allen J. Post-editing. Computers and translation: A translator’s guide. / J. Allen. – Amsterdam: John Benjamins, 2003. – 297-318 p.
5. Wagner E. Post-Editing Systran – A challenge for Commission Translators // Terminologie & Traduction. OPOCE. European Commission. – 2000. – P. 1-6.
6. Zetzsche J. Translation Technology Comes Full Circle // MultiLingual. – 2012. – 50-51 p.
7. Бархударов Л. С. Язык и перевод. Вопросы общей и частной теории перевода / Л. С. Бархударов. – М.: Международ. отношения, 1975. – 240 с.
8. Латышев Л. К. Курс перевода: эквивалентность перевода и способы ее достижения / Л. К. Латышев. – М.: Международные отношения, 1981. – 246 с.
9. Филиппович А. Ю. Системы машинного перевода. Лекции по дисциплине "Лингвистическое обеспечение АСОИУ" / А. Ю. Филиппович. – М.: МГТУ им. Н. Э. Баумана, 2012. – 12 с.
10. Денина О. О. Использование переводческих трансформаций для достижения адекватности перевода // Вестник Оренбургского государственного университета. – 2015. – №11 (186). – С. 186-191.
11. Сулейманова О. А., Беклемешева Н. Н., Карданова К. С. и др. Грамматические аспекты перевода / О. А. Сулейманова, Н. Н. Беклемешева, К. С. Карданова. – М.: Издательский центр «Академия», 2010. – 240 с.
12. Комиссаров В. Н. Современное переводоведение. Учебное пособие / В. Н. Комиссаров. – М.: ЭТС, 2002. – 424 с.

Расскажите о нас своим друзьям: