Источник: ITC.ua
Качество машинного перевода в современных сервисах за последнее время существенно повысилось, в чем далеко не последнюю роль сыграли нейронные технологии, но это справедливо далеко не для всех языковых пар.
Всегда наиболее сложным для машин был именно китайский, но, похоже, исследователям Microsoft (с помощью ИИ, разумеется) удалось покорить эту вершину.
По крайней мере, они так утверждают. По словам Microsoft, разработанная ими система переводит с китайского на английский не хуже переводчика-человека.
Собственно, в соответствии этих громких заявлений действительности любой желающий, располагающие достаточными знаниями языков, может убедиться сам, опробовав сервис в действии.
В Microsoft говорят, что весь секрет их успеха заключается в том, каким образом обучалась система.
Говоря конкретнее, вместо обычной техники перевода (статистического машинного перевода) Microsoft использовала глубокие нейронные сети, которые более точно имитируют поведение человека.
Команда разработчиков использовала методику двойного обучения с обратным переводом текста для оценки качества результата перевода.
Еще специалисты Microsoft для обеспечения работы системы задействовали нейросети сети специальной архитектуры (deliberation networks), которые имитируют процесс человеческого мышления с многократным пересмотром написанного, а также совместное обучение, где переводы фраз с английского на китайский использовались в качестве примеров для повышения точности передов с китайского на английский.
Разработанная система ИИ даже тренировалась выдавать одинаковые результаты при изменении направления текста (слева направо и наоборот).
В рамках обучения с системой также работали два независимых переводчиков, владеющих английским и китайским, которые указывали системе на ошибки.
Пока неясно, готова ли разработка к официальному запуску. Заявление Microsoft основано на результатах одиночного тестирования (хотя и тщательного) с обучением на текстах новостей.
То есть, система натренирована на официально-деловой стиль письма и едва ли она столь же хорошо сможет понимать предложения, написанные с грамматическими ошибками и сленговыми словами.
В любом случае это может стать если не прорывом, то значимым достижением в области машинного перевода.
Кроме того, положенная в основу методика обучения может найти применение и в других проектах создания систем ИИ.
Вообще же перевод – это сложно, ведь в этом деле нет других вариантов, кроме одного правильного, и если ИИ сможет полноценно освоить профессию переводчика, то будет способен на многое.