Как Google Translate переводит на русский слово «оккупант»?
С самого начала войны я, как и многие, начал постоянно следить за новостями. При этом в самых разных СМИ — я регулярно испытывал недоумение, натыкаясь в новостях на слово «кафиры», применяемое по отношению к вторгнувшимся российским войскам.
Если кто не в курсе, то «кафир», «кафиры» — это такой термин, которым мусульмане обозначают т.н. «неверных», т.е. не мусульман (или «неправильных» мусульман).
https://ru.wikipedia.org/wiki/Кафир
Разумеется, мне было непонятно, какая тут логика. Ну можно было бы понять такую обзывалку, если бы речь шла о какой-нибудь мусульманской стране, но Украина?
Причем бывало так что сегодня в новости «кафиры» присутствуют — а завтра уже нет. Или в ссылке ещё «кафиры», но в статье по ссылке — уже нет. Причём в употреблении этого слова были замечены СМИ самых разных масштабов: от ТСН, nv.ua или Forbes-Украина — до местечковых новостных сайтов, достаточно поискать в гугле «кафиры украина», чтобы увидеть охват (впрочем, в последнее время ТСН начали довольно быстро убирать это слово из новостей). Особенно пикантно получалось, когда термин «кафиры» применялся к «кадыровцам». Но и в РФ тоже заметили эту «кафирную» аномалию, и пытались использовать в своих пропагандистских целях.
Связанный с кафирами когнитивный диссонанс длился у меня недели две. В один из дней я даже попытался установить период, в который началось использование этого термина — оказалось что это началось ещё до войны, примерно осенью 2021, не позднее конца октября.
В попытках найти объяснение столь масштабному филологическому заскоку я было предположил, что это попытка придумать какой-нибудь короткий термин, сокращенное название для оккупантов. Подобно тому как в Афганистане душманов сокращенно называли «духи». Хотя «кафиры» и слово не так чтоб короткое, и логики в нём никакой не просматривается.
Должен признаться, сначала я подозревал в качестве распространителя одного популярного ныне военно-политического деятеля, а прочие авторы, подумал, решили ему подражать. Но когда слово «кафиры» встретилось в цитатах Зеленского — я решил что происходит что-то совсем непонятное.
В какой-то момент даже невольно задумался — может это у меня комп затроянен, и сам заменяет некоторые слова на веб-страницах? И вот тут, после того как я подумал что проблема может быть и техническая — сразу появилась мысль, в какую сторону смотреть.
Гипотеза получила подтверждение, когда я заглянул в Переводчик Google, и попробовал перевести слово «окупанти» с украинского языка на русский. Как дополнительный вариант к «оккупанты» — мне было предложено слово «кафиры». А при переводе предложений, выражений — «кафиры» шли по умолчанию, как основной вариант.
https://translate.google.com/?sl=uk&tl=ru&text=окупанти.
https://bit.ly/3N8XmER (цитата из заявления Зеленского)
Так разрешилась мучившая меня «загадка кафиров». Виновником оказался Google Translate, и множество СМИ, которые просто брали и переводили украинский текст на русский — с помощью машинного перевода, без вычитки.
Пока остаются неизвестными причины такого поведения Google Translate. Первое мое предположение было о том, что это было сделано умышленно — используя функцию «предложить перевод». Я по-прежнему склоняюсь к этой версии, хотя в принципе и могу допустить, глядя на разные странности у Google Translate с украинским языком, что произошел какой-то глюк, перекосивший языковую модель. Точные доказательства могут быть лишь у Гугла в логах.
Кроме того, неясно, есть ли ещё какие подобные «закладки». Также для меня осталось неизвестным, были ли случаи употребления «кафиров» на каких-либо официальных каналах, или только в новостных СМИ.
От вопроса «кто виноват» переходим к вопросу «что делать»:
— Для решения конкретно данной проблемы перевода «оккупанты» как «кафиры» — стоит массово обратиться к гуглу. Сообщать о неправильном переводе можно прямо со страницы гугл переводчика. Можно связаться и по другим каналам, у кого есть соответствующая возможность. При обнаружении ещё каких-то флуктуаций — стоит первым делом обращать внимание на переводчик.
— Тем ребятам, которые уже задумались, как, используя этот вектор атаки, подгадить россиянам, например испортить переводчик с русского на какой-нибудь другой язык, хочу сказать: не надо этого делать. В мире и так бардака больше чем взаимопонимания. Тем более что не сегодня-завтра РФ отключит себя от интернета, и на заложенные грабли будет наступать не путинский электорат, а какая-нибудь эвакуировшаяся в Европу гражданка Украины.
— Различным СМИ хочется пожелать почаще включать голову. Корректоры с редакторами — должны работать, в смысле выполнять свои обязанности, а не просто зарплату получать. У журналистов и так зачастую с грамотностью проблемы, а когда добавляется ещё и машинный перевод (неважно, с украинского на русский либо с русского на украинский) — то ошибки вообще идут косяком. Все эти «хранилище» вместо «убежище», «автоматный шар» вместо «автоматной пули», рассогласование падежей и прочая.
— Отдельно хочется отметить вызывающую у меня неприязнь концепцию «выделите ошибку мышкой», вместо выделения денег на редактора и вычитки контента. Как показывает практика, «краудчекинг» не особенно работает даже для средств массовой информации с большой посещаемостью — что уж там говорить о каких-то нишевых игроках. Также не стоит слишком уж доверчиво полагаться на искусственный интеллект и средства автоматизации — как и автомобильный навигатор, при бездумном использовании переводчик вполне способен завести не туда, куда нужно.
4 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів