公司新闻

Press Releases

企业全力投入神经机器翻译研究

作者:瑞科翻译 时间:2023-09-04 16:11:51 来源:瑞科翻译官网 标签:

2018年,神经机器翻译(NMT)研究最繁忙的一年。随着NMT 它已成为大型科技公司发布其最新研究成果的标准,在语言行业等领域进行产品化和整合。 密切关注NMT持续进步的一种方法是监控并提交给康奈尔大学门户网站arxiv.研究org。自2016年底 自从Slator开始跟踪arxiv上的NMT出版物以来,产量急剧增加。 2018年4月提交的文件创历史新高,仅在2018年5月和2018年8月再次攀升,这是迄今为止最繁忙的一个月。根据2015年3月15日Slator更新的arxivNMT重点或相关研究论文数量,2018年的研究活动是2017年的两倍多。 2017年,arxiv提交了199篇论文。2018年,有430个。研究产出自2014年以来一直在增长,五年内复合年增长率接近180%。 Neural Machine Translation Research Output Research papers published on Arxiv.org that mentioned neural machine translation in the title or abstract since January 1, 2014 to March 15, 2019 010203040502014201520162017201820192016920169 Source:ArxivGet the dataCreated with Datawrapper 研究趋势的方向 自从ArXiv开始出现NMT以来,许多研究方向一直是主要内容。例如,几乎总是有研究改进NMT输出和NMT系统的使用。最近,一些研究方向取得了成功,如资源匮乏的语言或语言“野外”培训数据几乎没有语言可用。 2018年最后一个季度,最重要的研究方向与确定NMT模型、新模型或改进模型和低资源语言的内部工作模式有关。 NMT内部工作的研究包括一些关注训练数据中两种噪声和其他问题的论文,以及评估NMT输出的不同方法。 Slator 2019神经机器翻译报告:部署NMT操作 SLNumber of research papers involving neural machine translation per company submitted to arXiv.org between January 1, 2018 and March 15, 2019 Research Papers Google 34 Microsoft 28 Tencent 14 Facebook 9 Amazon 7 IBM 7 Baidu 6 Alibaba 5 Huawei 4 Tilde 4 NTT Corp 3 SDL 3 Sogou 3 Unbabel 3 eBay 2 Intel 2 Petuum 2 Apple 1 Applied AI 1 Aylien 1 Hewlett Packard Enterprise 1 Lilt 1 Mitsubishi 1 NAVER 32页,NMT最新,5个案例研究,30个评论,NMT日常运营 一些研究人员研究了如何识别NMT模型中的重要神经元以及如何控制它们,而另一些研究人员则试图找出当前的方法,如标记化如何影响NMT输出。 至于新的或改进的NMT模型,实验增加了所谓的双门重复网络,取代了谷歌流行的Transformer架构中的模块,并开发了新的高质量的个性化模型(Lilt的研究)。 2018年第四季度,中国科技巨头腾讯研究了两种新的NMT方法:一种是全面学习系统,另一种是DTMT(深度过渡机器翻译)模型。 如今,NMT在处理低资源语言方面已经变得更好,许多其他人也开始关注这一挑战。例如,NAIST Japan试图用多种语言来源增加不完整的训练数据。 另一方面,中国电子商务巨头阿里巴巴以不同的方式接近低资源NMT。假设他们用各种语言训练NMT系统的图像描述,“视觉内容相同的不同语言的[描述]应大致相似。”微软希望调查所谓的转移学习,看看它能帮助减少多少资源短缺。 与此同时,研究活动明显放缓到12月,尚未恢复。前几年也出现了同样的趋势,并于2018年12月重复,当时的研究产量约为2018年11月的五分之一; 2019年1月至2月,研究活动继续减少。 这也可能受到研究人员提交论文的主要会议时间表的影响。其中一些包括2018年 2018年自然语言处理的经验方法和2019年10月31日至11月4日举行的 2019年1月26日至29日举行的应用机器学习日。 全力以赴开展NMT 2018年,企业参与NMT研究(而不是学术界)的数量也增加了,因为公司不仅继续从事研发工作,而且还进入了定制翻译甚至客户服务领域,通常适用于LSP。 谷歌、微软、百度等知名公司在2018年8月创纪录的月份(当时向arxiv提交了近60篇研究论文)显然很忙。 以下公司参与了2018年1月1日至2019年3月15日提交给arxiv的研究论文。请注意,并非所有这些公司涉及的论文都必须严格遵守NMT,尽管所有这些都与该技术有关。 arxiv是一个开放的平台,Slator的数据集仅限于某一类别和某些关键字。这意味着一些误报和重新提交会影响统计数据,arxiv上可访问的研究论文将取决于访问平台的日期。 最后,我们名单上最大的公司之一最近的发展发生在几天前。谷歌于2019年3月19日发表了一篇关于零镜头翻译最新进展的新研究论文。“零射击”它是一种NMT模型,可以在训练期间不存在的语言之间转换。 根据谷歌人工智能研究人员发表的题目“零射击神经机器翻译中缺失的成分”他们成功地将零射击NMT的输出与使用枢轴语言的无监督NMT一样好。NMT引擎使用类似于其目标语言的枢轴语言来弥补训练数据中的任何稀疏性。

上海瑞科翻译公司是一家具有二十年行业经验的专业翻译公司公司位居“亚太地区语言服务提供商前列是一家通过iso质量管理体系认证的知名的翻译公司.专注于文档翻译、网站翻译,认证翻译、本地化翻译、口译、软件本地化翻译、桌面排版(dtp)、母语审校、创译、语言资产管理以及翻译技术研发和培训等专业语言服务是专业的英语翻译公司,瑞科上海翻译公司可以提供中文、英语、日语、韩语、德语、法语、泰语、俄语等全球多语种的翻译,瑞科翻译机构是中国翻译协会(tac)理事单位,美国翻译协会(ata)会员,全球化与本地化协会(gala)会员欧洲语言行业协会会员上海瑞科翻译公司翻译服务热线:021-63760188