Робат са сваёй нагі. Як медыя і студэнты трапілі ў пастку машыннага перакладу

Кампактны дрон, які стаіць на гары / Komputronik S.A.
У беларускай медыяпрасторы перыядычна ўсплываюць перліны памылковага перакладу з рускай мовы на беларускую. Свежай знаходкай Еўрарадыё стала растыражараванае праз вайну ва Украіне слова “дрон”, якое праз сэрвіс google.translate па невядомай прычыне час ад часу перакладаецца як “робат са сваёй нагі”.
У такую няёмкую сітуацыю патрапілі шэраг выданняў і даследчыкаў.
Газета “Новы час” не заўважыла “нагу” у навіне пра тэхналогіі “Белпошты”, напісаную ў 2018 годзе.

Былі промахі і ў выдання “Хартыя 97” у навінах, звязаных з вайной ва Украіне і замахам на прэзідэнта Вэнесуэлы Нікаласа Мадура.

На сайце weaponews.com таксама сустракаецца гэты смешны пераклад у навінах за 2018 і 2020-ыя гады:

“Робат са сваёй нагі” знайшоўся ў дыпломнай працы студэнта Прыкладной матэматыкі і інфарматыкі БДУ Дзяніса Шыловіча. Яго памылку беражліва захавала Электронная бібліятэка БДУ:

"Беларуская мова не з'яўляецца прыярытэтнай для Google"
Чым жа можна патлумачыць такі дзіўны пераклад? Эксперты з айці-сферы разыходзяцца ў меркаваннях.
Стваральнік платформы “Голас” і “Новая Беларусь” Павел Лібер лічыць, што памылка магла закрасціся праз недасканаласць сэрвісу перакладу.
“Беларуская мова не з'яўляецца прыярытэтнай для Google, як і многія іншыя, напрыклад, грузінская або армянская. Раней Google перакладаў паводле правілаў і фраз, а потым перайшоў на машыннае навучанне і выкарыстанне моўных мадэляў. І тут важную ролю адыгрывае колькасць даступных матэрыялаў для трэніроўкі, іх распаўсюджанасць з абодвух бакоў (не толькі наколькі часта і як перакладаюць з рускай на беларускую, але і наадварот — з беларускай на рускую)”, — лічыць суразмоўца.
У сузаснавальніка партала Tut.by Кірыла Валошына іншая тэорыя. Ён называе прычынай знешняе ўмяшальніцтва ў працу сэрвіса.
“Хтосьці, скажам так, гібрыдна атакуе сэрвіс. Скардзяцца на натуральны вынік і масава прапануюць нібыта "лепшы" варыянт. Звычайна гэта працуе такім чынам. Тэарэтычна магчымыя маніпуляцыі праз паралельныя тэксты — маўляў, Google выкарыстоўвае паралельныя тэксты (напрыклад, артыкулы на дзвюх мовах) для навучання. Навошта і чаму — цяжка сказаць”, — разважае Валошын.
У лінгвістычнай суполцы фэйсбука “Толькі пра мову” карыстальнікі нестандартны пераклад дрону патлумачылі нізкай якасцю працы сэрвісу Google Translate.
“Гэты сэрвіс самае кепскае, чым вы можаце скарыстацца для машыннага перакладу. Там і “бялкі” становяцца “вавёркамі”, і “паводле” становіцца “па”, і “люстра” — “люстэркам”, і “дрон” – “робатам са сваёй нагі”. Прычым за апошнія 10 гадоў нічога не замянілася, я ўпершыню з гэтай праблемай перакладу слова “дрон” сутыкнуўся акурат 10 гадоў таму. Калі ўжо трэба, то лепей скарыстацца, прасьці госпадзі, “Яндэксам”, ён амаль ідэальна перакладае. Але найлепшы інструмент цяпер — гэта ChatGPT”.
Дзеля справядлівасц, Google Translate зараз далёка не заўсёды памылкова перакладае слова “дрон”. Але ўсё роўна варта заставацца пільным і пераправяраць пераклад за сэрвісам. Ці давяраць, як ужо заўважылі вышэй больш якасным сэрвісам, тыпу ChatGPT ці Yandex Translate.
Каб сачыць за галоўнымі навінамі, падпішыцеся на канал Еўрарадыё ў Telegram.
Мы штодня публікуем відэа пра жыццё ў Беларусі на Youtube-канале. Падпісацца можна тут.