Использование машинного перевода Google Translate только вредит «Википедии»

«Википедия» была создана с целью сделать знания доступными каждому, однако большая часть материала публикуется на английском языке.

На текущий момент англоязычная «Википедия» является крупнейшим изданием с 5,5 млн статей. Только 15 из 301 издания могут похвастаться тем, что количество их статей превысило отметку 1 млн.

Но зачастую их качество оставляет желать лучшего, не говоря уже о том, что некоторые важные материалы попросту отсутствуют. В самой «Википедии» эту проблему связывают с машинным переводом.

В январе этого года некоммерческая организация Wikimedia Foundation заключила соглашение с компанией Google, согласно которому последняя разрешила редакторам «Википедии» использовать переводчик Google Translate наряду с собственным инструментом перевода контента на основе программного обеспечение с открытым исходным кодом.

Но для редакторов, работающих с неанглоязычными изданиями, это оказалось ещё большей проблемой, что возобновило дискуссию о том, а нужно ли «Википедии» вообще использовать машинный перевод.

При правильном использовании автоматический перевод может сэкономить драгоценное время редакторам, создающим недоукомплектованные издания.

В противном случае результаты могут быть катастрофическими. Например, редактор португальской «Википедии» указал на недопустимый машинный перевод с английского языка на португальский в одной из статей, в которой оригинальное выражение «village pump» (сельский колодец/насосная станция) превратилось в «bomb the village» (бомбить деревню).

Автоматические переводы стали такой проблемой, что в некоторых редакциях «Википедии» создали специальные правила, которые позволяют редакторам исключать подобные статьи или удалять, если для них не существует других версий перевода.

Для упрощённого удаления этих статей даже есть специальный критерий «X2. Страницы, созданные с помощью инструмента перевода».

Профессор Дуглас Хофштадтер (Douglas Hofstadter) из Индианского университета в Блумингтоне считает неверным мнение о том, что ИИ достиг паритета с человеком в возможностях перевода.

В своей статье по этой теме он утверждает, что машинный перевод является поверхностным, ИИ обычно пропускает более глубокое значение слов и предложений.

Такие системы учатся переводить, изучая статистические закономерности в больших массивах данных, а это означает, что они слепы к нюансам языка и испытывают недостаток в здравом смысле.

Проблема «Википедии» в том, что их машинный перевод требует пристального контроля со стороны редакторов.

Они должны хорошо понимать оба языка, на которые осуществляется перевод, однако в реальности (особенно для маленьких изданий) это не всегда так, поскольку статьями по большому счёту занимаются обычные пользователи-добровольцы. Зачастую эти пользователи используют автоматический перевод и публикуют статьи без каких-либо рецензий.

В результате мы имеем некачественный перевод статьи или откровенную чушь.

В конечном счёте это может привести к потере авторитета «Википедии» как надёжного источника информации.

Критиков машинного перевода немало. Сообщество индонезийской «Википедии» даже официально потребовало от Wikimedia Foundation удалить инструмент машинного перевода из издания.

Большинство пользователей склоняются к тому, что машина никогда не заменит человека в переводе, просто потому, что не может понимать сложные фразы, которые не переводятся дословно.

Подписывайтесь на наш Telegram канал

Источник: ITC.ua



Самые актуальные новости - в Telegram-канале

Читайте также

Вверх