Робат са сваёй нагі. Как медиа и студенты попали в ловушку машинного перевода

Компактный дрон, стоящий на горе / Komputronik S.A.
В белорусском медиапространстве периодически всплывают жемчужины ошибочного перевода с русского языка на белорусский. Свежей находкой Еврорадио стало растиражированное из-за войны в Украине слово “дрон”, которое через сервис google.translate по неизвестной причине время от времени переводится как “робат са сваёй нагі”.
В такую неловкую ситуацию попали ряд изданий и исследователей.
Газета "Новое время“ не заметила ”ногу“ в новости о технологии ”Белпочты", написанную в 2018 году.

Были промахи и у издания "Хартия 97" в новостях, связанных с войной в Украине и покушением на президента Венесуэлы Николаса Мадуро.

На сайте weaponews.com также встречается этот смешной перевод в новостях за 2018 и 2020-ые годы:

“Робат са сваёй нагі” нашелся в дипломной работе студента прикладной математики и информатики БГУ Дениса Шиловича. Его ошибку бережно сохранила Электронная библиотека БГУ:

"Белорусский язык не является приоритетным для Google"
Чем же можно объяснить такой странный перевод? Эксперты из IT-сферы расходятся в мнениях.
Создатель платформ "Голос" и "Новая Беларусь" Павел Либер считает, что ошибка могла закрасться из-за несовершенства сервиса перевода.
"Белорусский язык не является приоритетным для Google, как и многие другие, например, грузинский или армянский. Раньше Google переводил по правилам и фразам, а потом перешёл на машинное обучение и использование языковых моделей. И здесь важную роль играет количество доступных материалов для обучения, их распространённость с обеих сторон (не только как часто и как переводят с русского на белорусский, но и наоборот — с белорусского на русский)", — считает собеседник.
У сооснователя портала Tut.by Кирилла Волошина другая теория. Он называет причиной внешнее вмешательство в работу сервиса.
"Кто-то, скажем так, гибридно атакует сервис. Жалуются на естественный результат и массово предлагают якобы "лучший" вариант. Обычно это работает именно так. Теоретически возможны манипуляции через параллельные тексты — мол, Google использует параллельные тексты (например, статьи на двух языках) для обучения. Зачем и почему — сложно сказать", — рассуждает Волошин.
В лингвистическом сообществе Facebook "Толькі пра мову" пользователи объяснили нестандартный перевод слова "дрон" низким качеством работы сервиса Google Translate.
"Этот сервис — худшее, чем вы можете воспользоваться для машинного перевода. Там и “бялкі” становятся “вавёркамі”, и “паводле” становится “па”, и “люстра” — “люстэркам”, и “дрон” — “робатам са сваёй нагі”. Причём за последние 10 лет ничего не изменилось, я впервые столкнулся с этой проблемой перевода слова “дрон” ровно 10 лет назад. Если уж надо, то лучше воспользоваться, прости господи, “Яндексом”, он переводит почти идеально. Но лучший инструмент сейчас — это ChatGPT".
Справедливости ради, Google Translate сейчас далеко не всегда ошибается при переводе слова "дрон". Но всё равно стоит быть внимательным и перепроверять перевод. Или довериться, как уже отметили выше, более качественным сервисам, вроде ChatGPT или yandex.translate.
Чтобы следить за важными новостями, подпишитесь на канал Еврорадио в Telegram.
Мы каждый день публикуем видео о жизни в Беларуси на Youtube-канале. Подписаться можно тут.