账号:
密码:
最新动态
产业快讯
CTIMES/SmartAuto / 新闻 /
微软AI又一里程碑:微软中翻英机器水准”媲美人类”
 

【CTIMES / SMARTAUTO ABC_1 报导】    2018年03月15日 星期四

浏览人次:【2547】

继在语音辨识和机器阅读领域取得的“过人”成绩,由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队3月15日宣布,其研发的机器翻译系统在通用新闻报导测试集newstest2017的中翻英测试集上,达到了可与人工翻译媲美的水准。这是第一个在新闻报导的翻译品质和准确率上可以比肩人工翻译的翻译系统。

微软亚洲研究院??院长、机器学习组负责人 刘铁岩/ 微软亚洲研究院??院长、自然语言计算组负责人 周明/ 微软技术院士 黄学东。

newstest2017新闻报导测试集由产业界和学术界的合作夥伴共同开发,并於去年秋天在WMT17大会上发布。为了确保翻译结果准确且达到人类的翻译水准,微软研究团队邀请了双语语言顾问将微软的翻译结果与两个独立的人工翻译结果进行了比较评估。

微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东称,这是对自然语言处理领域最具挑战性任务的一项重大突破。「在机器翻译方面达到与人类相同的水准是所有人的梦想,我们没有想到这麽快就能实现。」他表示,「消除语言障碍,代表人们的沟通进步,这非常有意义,值得我们多年来为此付出的努力。」

机器翻译是科研人员攻坚了数十年的研究领域,曾经很多人都认为机器翻译根本不可能达到人类翻译的水准。虽然此次突破意义非凡,但研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终极目标又更近了一步。微软亚洲研究院??院长、自然语言计算组负责人周明表示,在WMT17测试集上的翻译结果达到人类水准很鼓舞人心,但仍有很多挑战需要我们解决,比如在即时的新闻报导上测试系统等。

微软机器翻译团队研究经理Arul Menezes表示,团队想要证明的是:当一种语言对(比如中-英)拥有较多的训练资料,且测试集中包含的是常见的大众类新闻词汇时,那麽在人工智慧技术的加持下机器翻译系统的表现可以与人类媲美。

虽然学术界和产业界的科研人员致力於机器翻译研究很多年,但近两年深度神经网路的使用让机器翻译的表现取得了很多实质性突破,翻译结果相较於以往的统计机器翻译结果更加自然流畅。为了能够取得中-英翻译的里程碑式突破,来自微软亚洲研究院和雷德蒙研究院的三个研究组,进行了跨越中美时区、跨越研究领域的联合创新。

其中,微软亚洲研究院机器学习组将他们的最新研究成果 - 对偶学习(Dual Learning)和推敲网路(Deliberation Networks)应用在此次取得突破的机器翻译系统中。

微软亚洲研究院??院长、机器学习组负责人刘铁岩介绍道,「这两个技术的研究灵感其实都来自於我们人类的做事方式。」对偶学习利用的是人工智慧任务的天然对称性。当我们将其应用在机器翻译上时,效果就好像是通过自动校对来进行学习 - 当我们把训练集中的一个中文句子翻译成英文之後,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对,进而从这个比对结果中学习有用的回??资讯,对机器翻译模型进行修正。而推敲网路则类似於人们写文章时不断推敲、修改的过程,通过多轮翻译,不断地检查、改善翻译结果,从而使翻译的品质大幅提升。对偶学习和推敲网路的工作发表在NIPS、ICML、AAAI、IJCAI等人工智慧的全球顶级会议上,并且已被其他学者推广到机器翻译以外的研究领域。

周明带领的自然语言计算组多年来一直致力於攻克机器翻译,这一自然语言处理领域最具挑战性的研究任务。周明表示:「由於翻译没有唯一的标准答案,它更像是一种艺术,因此需要更加复杂的演算法和系统去应对。」自然语言计算组基於之前的研究积累,在此次的系统模型中增加了另外两项新技术:联合训练(Joint Training)和一致性规范(Agreement Regularization),以提高翻译的准确性。联合训练可以理解为用反覆运算的方式去改进翻译系统,用中英翻译的句子对去补充反向翻译系统的训练资料集,同样的过程也可以反向进行。一致性规范则让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。

可以说,两个研究组分别将各自所在领域的累积与最新发现应用在此次的机器翻译系统中,从不同角度切入,让翻译品质大幅提升。在专案合作过程中,他们每周都会与雷德蒙总部的团队开会讨论,确保技术可以无缝融合,系统可以快速反覆运算。

newstest2017新闻报导测试集包括约2000个句子,由专业人员从线上报纸样本翻译而来。微软团队对测试集进行了多轮评估,每次评估会随机挑选数百个句子翻译。为了验证微软的机器翻译是否与人类的翻译同样出色,微软没有停留在测试集本身的要求,而是从外部聘请了一群双语语言顾问,将微软的翻译结果与人工翻译进行比较。

验证过程之复杂也从另一个侧面展现了机器翻译要做到准确所面临的复杂性。对於语音辨识等其它人工智慧任务来说,判断系统的表现是否可与人类媲美相当简单,因为理想结果对人和机器来说完全相同,研究人员也将这种任务称为模式识别任务。

然而,机器翻译却是另一种类型的人工智慧任务,即使是两位专业的翻译人员对於完全相同的句子也会有略微不同的翻译,而且两个人的翻译都不是错的。那是因为表达同一个句子的“正确的”方法不止一种。 周明表示:「这也是为什麽机器翻译比纯粹的模式识别任务复杂得多,人们可能用不同的词语来表达完全相同的意思,但未必能准确判断哪一个比较好。」

复杂性让机器翻译成为一个极有挑战性的问题,但也是一个极有意义的问题。刘铁岩认为,我们不知道哪一天机器翻译系统才能在翻译任何语言、任何类型的文本时,都能在“信、达、雅”等多个维度上达到专业翻译人员的水准。不过,他对技术的进展表示乐观,因为每年微软的研究团队以及整个学术界都会发明大量的新技术、新模型和新演算法,「我们可以预测的是,新技术的应用一定会让机器翻译的结果日臻完善。」

研究团队还表示,此次技术突破将被应用到微软的商用多语言翻译系统产品中,从而?明其它语言或词汇更复杂、更专业的文本实现更准确、更地道的翻译。此外,这些新技术还可以被应用在机器翻译之外的其他领域,催生更多人工智慧技术和应用的突破。

關鍵字: 自然语言  机器翻译  Microsoft 
相关新闻
微软启动「AI+ Taiwan」计画 在台资料中心正式启用
Ansys、台积电和微软合作 提升矽光子元件模拟分析速度达10倍
微软全新自主agents赋能团队实现更多拓展性
报告:Action12024 年软体漏洞评级五大趋势
微软揭露企业AI领导力五大关键 多元应用赋能企业数位转型
comments powered by Disqus
相关讨论
  相关文章
» ChipLink工具指南:PCIe® 交换机除错的好帮手
» 创新光科技提升汽车外饰灯照明度
» 以模拟工具提高氢生产燃料电池使用率
» 掌握石墨回收与替代 化解电池断链危机
» SiC MOSFET:意法半导体克服产业挑战的颠覆性技术


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK8BU0EHT8WSTACUKL
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: [email protected]