公司新闻

Press Releases

翻译配音:AmazonAI开辟了自动化媒体本地化的新篇章

作者:瑞科翻译 时间:2023-08-17 14:54:20 来源:瑞科翻译官网 标签:



云配音在2019年也是如此。机器翻译研究人员正在探索自然语言处理(机器配音)的新领域。一个2020年1月在亚马逊人工智能和亚马逊网络服务上研究论文的小组(AWS)探索新技术进行自动配音的单位看起来更自然。 这个小组由Marcelllo组成 Federico领导,他的简历包括翻译效率工具Matecat的共同创始人,以及Translated.net的ModernMT(MMT)ModernMT是为翻译行业设计的开源机器翻译(MT)软件。Federico于2018年9月加入AWS担任首席应用科学家。 正如论文所指出的,由于Netflix、亚洲品牌HOOQ和亚马逊自己的Prime, 包括Video在内的流媒体平台正在制作和提供在线内容,因此对自动配音的需求可能非常大。 然而,传统的配音是昂贵的。在媒体行业商业网络DPP组织的本地圆桌会议上,一位与会者强调:“本地化是世界上最高的编程成本之一。配音成本特别高。特殊人才可能是参与特定市场的关键。” 开拓创新 自动配音可视为从语音到语音翻译(STST)扩展旨在用其他语言取代视频中的所有语音,并尽可能保持自然的外观和声音。STST已经成为机器翻译研究社区的新焦点。例如,谷歌推出了一个名为Translatotron的系统,而Microsoft在其Microsoft中 Inspire 他们声称直接STST的系统显示在2019年会议上。 研究人员认为,他们“是自动转录的第一项工作,集成了强化的深度学习模式”,用于机器翻译(MT),文本语音转换(TTS)以及音频渲染,并在真实视频中进行评估。” 研究人员从六个TED演讲英语中选择了24个视频片段。每个编辑持续约10到15秒,只包括一个演讲者至少说两个句子,在编辑过程中,演讲者的大部分脸都可以看到。 根据时间限制,团队操纵MT模型生成所需长度的意大利句子。(当然,该团队使用Amazon Translate作为其基准MT系统。) 该团队确保意大利TTS输出的持续时间与原始英语音频的持续时间相匹配。他们还执行“音频渲染”,从原始视频中提取背景音频(语音以外的所有内容),然后重新添加到配音版本中,使其听起来更自然。 根据14名志愿者(5名意大利演讲者和9名非意大利演讲者)对三个视频片段的评分,对内容的理解确实会影响观众对自动配音质量的看法。说意大利语的人倾向于把系统A(只有STST功能)列为最佳版本,而不是意大利语的人则认为系统A是最差的版本。 太慢,太快或太不均匀,太快或太快 “意大利观众留下的评论[显示],系统B [STST加上增强的MT和节奏对齐]的主要问题是说话率不自然,即太慢、太快或太不均匀,”研究人员写道。 相比之下,非意大利语发言人对C系统(B系统和音频渲染)表现出明显的统计偏好,研究人员认为这表明“包括副语言(如掌声、笑话中观众的笑声等)的相关性。). )和声条件(如混响、环境噪声等。).” 基于这些反馈,研究人员希望他们未来的工作将包括在内“计算更好的分割,引入更灵活的唇形同步”。

上海瑞科翻译公司是一家具有二十年行业经验的专业翻译公司公司位居“亚太地区语言服务提供商前列是一家通过iso质量管理体系认证的知名的翻译公司.专注于文档翻译、网站翻译,认证翻译、本地化翻译、口译、软件本地化翻译、桌面排版(dtp)、母语审校、创译、语言资产管理以及翻译技术研发和培训等专业语言服务是专业的英语翻译公司,瑞科上海翻译公司可以提供中文、英语、日语、韩语、德语、法语、泰语、俄语等全球多语种的翻译,瑞科翻译机构是中国翻译协会(tac)理事单位,美国翻译协会(ata)会员,全球化与本地化协会(gala)会员欧洲语言行业协会会员上海瑞科翻译公司翻译服务热线:021-63760188