行业洞见

Our Insights

机器翻译技术的发展态势

2025-06-10

经过 70 多年的发展,机器翻译在翻译质量、系统性能、实用性、规模化应用等方面均取得了较大飞跃。机器翻译呈现百花齐放、满园春色的蓬勃发展新态势,其产业应用也呈现一派欣欣向荣的景象。目前机器翻译技术有以下五大发展趋势:

1. 深度学习技术不断发展,神经网络机器翻译成为主流

近年来,机器翻译的快速进步主要得益于深度学习技术的发展。神经网络机器翻译在 2014年左右萌芽,并迅速茁壮成长。借助深度神经网络模型在语义表示及理解方面的能力,以及大数据、大算力的支持,神经网络机器翻译的译文质量大幅跃升,迅速实现了对统计机器翻译的超越和替换,将机器翻译带入新的发展阶段。

2. 研发门槛降低,机器翻译进入规模化应用阶段

受技术进步、市场需求增多等多重因素影响,国内外相关行业公司热情高涨,均投入大量资金和精力研发大规模翻译系统。国外有谷歌、微软(Microsoft)、Meta(原 Facebook)等,国内有百度、阿里巴巴、腾讯、有道、讯飞等。值得一提的是,国内公司研发的机器翻译系统在技术上 具有很强的竞争力,多次在国际机器翻译系统评测中拔得头筹。先进技术通过开源开放平台共享, 使得产业各方都可以使用已有的技术成果,研发新的技术。在深度学习平台方面,国外有 Meta 的 Pytorch、 谷歌的 Tensorflow, 国内有百度的飞桨 (PaddlePaddle) 等,都集成了最新的机器翻译技术。无论是研究人员还是开发者,都无需从头做起,只要有数据,就可以迅速利用开源平台搭 建一个机器翻译系统,大幅降低了机器翻译研发门槛。得益于此,机器翻译创业公司也如雨后春笋般涌现 。

3. 机器翻译与行业紧密结合,得到广泛应用和认可

随着国际化进程的加速,传统行业对高效率、高质量的机器翻译技术的需求愈加旺盛。不同领 域对行业术语和文体风格等需求各不相同,对译文的要求也不尽相同。神经网络机器翻译可以在大 规模数据预训练基础上,结合行业知识和领域数据,进行优化精调,进一步提升垂直领域的翻译质量。 尤其在新闻资讯、学术文献、金融财经、生物医药、信息技术等领域,经过优化训练的机器翻译系统译文的准确度可以达到 90% 以上。

随着国际化进程的加速,传统行业对高效率、高质量的机器翻译技术的需求愈加旺盛。不同领 域对行业术语和文体风格等需求各不相同,对译文的要求也不尽相同。神经网络机器翻译可以在大 规模数据预训练基础上,结合行业知识和领域数据,进行优化精调,进一步提升垂直领域的翻译质量。 尤其在新闻资讯、学术文献、金融财经、生物医药、信息技术等领域,经过优化训练的机器翻译系统译文的准确度可以达到 90% 以上。

4. 多语言翻译市场需求巨大,相关研究和应用发展迅速

当今世界多种文明和文化相互融合,人类社会丰富多样的语言交相辉映,“开放共享、合作共 赢”越来越成为各国共识,成为推动社会进步的重要理念。实现高效的多语言翻译,搭建不同语言 顺畅交流的桥梁,是时代和社会发展的迫切需求。随着“一带一路”倡议的深化发展,截至 2023 年 1 月,已有 151 个国家和 32 个国际组织与中国签署共建“一带一路”合作文件1,其中涉及的语 言超过 110 种。多语言翻译面临语言资源分布不均衡、非通用语种语言资源匮乏、语言差异大、部 署成本高等挑战,如何克服这些困难备受瞩目,成为国内外前沿课题研究的焦点。近年来,学术界、 产业界围绕数据增强、多语言统一建模、多语言预训练等内容开展了诸多研究,促进了多语言翻译 技术的发展。得益于此,国内外主流的机器翻译系统均支持多语言翻译。截至 2023 年初,百度、 讯飞、小牛、谷歌、微软等国内外机器翻译系统均支持上百种语言互译。

5. 翻译模式由文本翻译扩展到跨模态翻译,应用场景愈加丰富

随着智能设备的普及,翻译需求和场景日趋多样。人工智能技术在图像、语音等领域的进步为跨模态翻译提供了技术支持。如结合图像技术的拍照翻译和增强现实翻译,被广泛用于票据翻译、 外语学习等场景;结合语音技术的语音翻译广泛用于日常会话、会议演讲等场景,提升了沟通效率。 2018 年,《麻省理工科技评论》(MIT Technology Review) 将“语音翻译”列为全球十大技术突破, 百度和谷歌 (Google) 被列为“关键参与者 (Key Player)”。在 2020 年国际计算语言学学会 (ACL) 年会上,百度、谷歌、脸书、清华大学、宾夕法尼亚大学(University of Pennsylvania) 联合举 办了首届机器同传研讨会,极大地促进了相关技术发展。近年来,机器同传在翻译质量、同传时延 等方面取得显著进步,机器同传被越来越广泛地应用于国际会议。

本文来源:《2023 机器翻译技术及产业应用蓝皮书》