机器翻译革命强势来袭

机器翻译革命强势来袭

神经机器翻译(NMT)自2014年在科学论文中首次被提及以来,已使机器翻译领域出现翻天覆地的变化,它开始全面超越以统计模型为基础的统计机器翻译(SMT),快速成为在线翻译系统的主流标配。

神经机器翻译的神经元可以学习和收集信息,模仿人类大脑的神经元建立联系。它克服了传统方法将句子分割为不同片段进行翻译的缺点,充分利用上下文信息,对句子进行整体编码和解码,从而生成更为流畅的译文。

市面上的神经机器翻译系统越来越多,国内的阿里巴巴、腾讯、百度、科大讯飞、搜狗,国外的谷歌、脸书、微软等都在布局,这使相关技术发生质变

如今,许多出租车司机都能用手机上的翻译软件,轻松和老外沟通。在不少国际会议上,机器翻译干脆直接扮演现场同声传译角色。

技术发展对这场翻译革命也功不可没。语音识别包括远场识别、噪音识别以及多轮交互,是人工智能的重要切入点。

因此,这场机器翻译技术革命,正是人工智能革命梦想照进现实的重要一环。

应用场景日渐丰富:

机器翻译应用量正呈加速增加态势。据官方信息显示,机器翻译在阿里巴巴内部可以每天翻译出几十亿量级的产品信息,每天的在线翻译请求达到数亿次。在电子邮件和网站页面语言转换方面,谷歌公司称,其机器翻译服务每天在全世界被使用超过10亿次。

旅游业对翻译需求更加旺盛。有数据显示,中国已成为世界第一大出境旅游客源国。2017年中国公民出境旅游突破1.3亿人次,花费达1152.9亿美元。解决语言沟通问题正成为越来越多中国出境游客的迫切需求。

许多中国游客借助智能翻译软件和机器,轻松搞定国外道路路牌、餐馆菜单和超市购物,甚至在旅途中认识外国朋友。各大技术企业也在争夺这一巨大市场。

机器翻译的应用场景正不断丰富,越来越多的政府和企业网站需将内容多语言化;视频网站可能需要借助机器翻译将视频内容翻译成多语言版本;就连人工翻译服务供应商也会借助机器翻译来提升人工翻译的效率。

人机翻译相辅相成:

人们发现,对于夫妻肺片等专有名词以及唐诗宋词,机器翻译能力已有了长足进步,但面对杠精等网络热词以及新流行语的翻译能力仍有待提高。

尽管在达沃斯年会等一些国际论坛上,智能同传翻译应用越来越多,但在个别场合,机器翻译也闹过一些令人费解的乌龙

这说明,人工智能翻译要充分考虑复杂性。一些会议现场语言多样,话题专业性强,噪音干扰多,而且讲话者的语言习惯和口音也各不相同,即使能从嘈杂的环境中提取主要音色,语义识别仍充满挑战。

专家认为,人工翻译是一个阅读-内化-表达的过程,人类读到文本之后,会联想到相关现实场景,然后给出另一种语言对这种场景的表达。但机器翻译通常只是一个解码过程,将原文看成被加密的译文。这样的过程缺乏现实体验,谈不上理解,自然难免出错。

总体而言,人工翻译与纸面翻译供给能力有限,但翻译水准专业、精准,至少目前依然不可缺少;日常交流沟通不需要特别高质量的同声传译,机器翻译在这方面市场前景巨大。

因此,人机应该成为一套耦合的系统,适合机器干的,交给机器;适合人工做的,还是由人完成。不要因为机器翻译的进步,就吆喝着大家都别学外语;也不要因为人工智能翻译的失误,就否定其巨大作用。