Робат са сваёй нагі. Как медиа и студенты попали в ловушку машинного перевода

Компактный дрон, стоящий на горе

Компактный дрон, стоящий на горе / Komputronik S.A.

В белорусском медиапространстве периодически всплывают жемчужины ошибочного перевода с русского языка на белорусский. Свежей находкой Еврорадио стало растиражированное из-за войны в Украине слово “дрон”, которое через сервис google.translate по неизвестной причине время от времени переводится как “робат са сваёй нагі”. 

В такую неловкую ситуацию попали ряд изданий и исследователей.

Газета "Новое время“ не заметила ”ногу“ в новости о технологии ”Белпочты", написанную в 2018 году.

Робат са сваёй нагі. Як медыя і студэнты трапілі ў пастку машыннага перакладу

Были промахи и у издания "Хартия 97" в новостях, связанных с войной в Украине и покушением на президента Венесуэлы Николаса Мадуро.

Робат са сваёй нагі. Як медыя і студэнты трапілі ў пастку машыннага перакладу

На сайте weaponews.com также встречается этот смешной перевод в новостях за 2018 и 2020-ые годы:

Робат са сваёй нагі. Як медыя і студэнты трапілі ў пастку машыннага перакладу

“Робат са сваёй нагі” нашелся в дипломной работе студента прикладной математики и информатики БГУ Дениса Шиловича. Его ошибку бережно сохранила Электронная библиотека БГУ:

Робат са сваёй нагі. Як медыя і студэнты трапілі ў пастку машыннага перакладу

"Белорусский язык не является приоритетным для Google"

Чем же можно объяснить такой странный перевод? Эксперты из IT-сферы расходятся в мнениях.

Создатель платформ "Голос" и "Новая Беларусь" Павел Либер считает, что ошибка могла закрасться из-за несовершенства сервиса перевода.

"Белорусский язык не является приоритетным для Google, как и многие другие, например, грузинский или армянский. Раньше Google переводил по правилам и фразам, а потом перешёл на машинное обучение и использование языковых моделей. И здесь важную роль играет количество доступных материалов для обучения, их распространённость с обеих сторон (не только как часто и как переводят с русского на белорусский, но и наоборот — с белорусского на русский)", — считает собеседник.

У сооснователя портала Tut.by Кирилла Волошина другая теория. Он называет причиной внешнее вмешательство в работу сервиса.

"Кто-то, скажем так, гибридно атакует сервис. Жалуются на естественный результат и массово предлагают якобы "лучший" вариант. Обычно это работает именно так. Теоретически возможны манипуляции через параллельные тексты — мол, Google использует параллельные тексты (например, статьи на двух языках) для обучения. Зачем и почему — сложно сказать", — рассуждает Волошин.

В лингвистическом сообществе Facebook "Толькі пра мову" пользователи объяснили нестандартный перевод слова "дрон" низким качеством работы сервиса Google Translate.

"Этот сервис — худшее, чем вы можете воспользоваться для машинного перевода. Там и “бялкі” становятся “вавёркамі”, и “паводле” становится “па”, и “люстра” — “люстэркам”, и “дрон” — “робатам са сваёй нагі”. Причём за последние 10 лет ничего не изменилось, я впервые столкнулся с этой проблемой перевода слова “дрон” ровно 10 лет назад. Если уж надо, то лучше воспользоваться, прости господи, “Яндексом”, он переводит почти идеально. Но лучший инструмент сейчас — это ChatGPT".

Справедливости ради, Google Translate сейчас далеко не всегда ошибается при переводе слова "дрон". Но всё равно стоит быть внимательным и перепроверять перевод. Или довериться, как уже отметили выше, более качественным сервисам, вроде ChatGPT или yandex.translate.

Чтобы следить за важными новостями, подпишитесь на канал Еврорадио в Telegram.

Мы каждый день публикуем видео о жизни в Беларуси на Youtube-канале. Подписаться можно тут.