公司新闻

Press Releases

Masakhane项目将非洲置于机器翻译地图上

作者:瑞科翻译 时间:2023-08-17 14:54:23 来源:瑞科翻译官网 标签:



对于参考数据较多的语言,机器翻译(MT)它显示出更强大的功能和更快的进步。Masakhane项目联合创始人兼首席研究员·马丁努斯(Laura Martinus)和贾德·阿伯特(Jade Abbott)在自然语言处理方面,非洲历史上一直缺乏这些数据的地区之一(NLP)非洲2.000多种语言在该领域缺乏代表性。 两位南非人描述了一个自我失败的循环,发言人认为他们的语言不会被接受为主要的交流方式。另一方面,这导致翻译项目缺乏资金和语言资源;确实存在的机构往往与特定国家的机构孤立。 受2018年Indaba深度学习主题的启发,Martinus和Abbott启动了Masakhane项目(其名称为isizulu)“我们共同构建”),连接不同国家NLP专业人员的最终目标是将Internettet连接到不同国家“它的内容被翻译成我们的语言,反之亦然。” 目前,来自15个国家/地区的60多名参与者参与了非洲大陆建立非洲语言MT模型的工作。(Masakhane项目还与威特沃特斯兰德大学RAIL实验室和无国界译者合作。) 计划:收集语言数据,开发MT模型,然后进行分析和微调。 Martinus和Abbott已经训练使用卷积序列转换(Convs2S)将英语翻译成南非11种官方语言中的5种模型(南非语、伊斯祖鲁语、北索托语、塞茨瓦纳语、锡松加语)。他们在计算语言学协会(ACL)在2019年年会上介绍了他们的发现。 自2019年11月被VentureBeat介绍以来,该小组继续使用各种语言工作,并强调公开披露任何收入以打击相关资源“低可发现性”,这是许多非洲语言的主要挑战。 Kathlenen首席研究员 Siminyu告诉Slator,在Masakhane项目的GitHub页面上,有16种基准语言可以看到。 Martinus告诉Slators:“我们目前收到了很多论文,所以这个数字经常增加。”“我认识的一些人想尽快提交基准,但还没有完成。” 雅培于2020年1月22日在一个针对特定领域的平台上发微博,称德国博士学位学生的贡献者朱莉亚·克罗伊策尔“用JoeyNMT训练英语到南非荷兰语的模型,并将其部署为我们@MasakhaneMT上的懒机器人。帐户闲置(南非荷兰语之所以选择,是因为他会说德语,所以她可以算是有用的)。” Kreutzer将JoeyNMT(也可在GitHub上描述)“极简主义神经机器翻译工具包专为新手设计[…]”。 Masakhane项目计划参加2020年4月在埃塞俄比亚举行的AfricaNLP讲座。Siminyu说:“现在看来,我们将提交六篇论文,也许还会有更多。” Martinus补充说,目前很多Masakhane参与者也在2020年5月由南非数字语言资源中心组成(SADiLaR)首届非洲土著语言资源主办(RAIL)在研讨会上写论文。

上海瑞科翻译公司是一家具有二十年行业经验的专业翻译公司公司位居“亚太地区语言服务提供商前列是一家通过iso质量管理体系认证的知名的翻译公司.专注于文档翻译、网站翻译,认证翻译、本地化翻译、口译、软件本地化翻译、桌面排版(dtp)、母语审校、创译、语言资产管理以及翻译技术研发和培训等专业语言服务是专业的英语翻译公司,瑞科上海翻译公司可以提供中文、英语、日语、韩语、德语、法语、泰语、俄语等全球多语种的翻译,瑞科翻译机构是中国翻译协会(tac)理事单位,美国翻译协会(ata)会员,全球化与本地化协会(gala)会员欧洲语言行业协会会员上海瑞科翻译公司翻译服务热线:021-63760188