校园招聘信息
请以中国出版集团的校招通知为准
全站>新闻中心> 详情

要闻 | 中译语通参与大模型标准的编制,入选“2022年大模型优秀应用案例”

本部要闻 来源:中译语通日期:2022-08-21浏览次数:3791

2022年8月16日,由中国信息通信研究院、人工智能关键技术与应用评测工业和信息化部重点实验室等机构主办的“2022可信AI峰会”在北京召开,峰会论坛上发布了“大模型技术和应用评测标准”,公布了“2022年大模型优秀应用案例”名单。

中译语通科技股份有限公司(以下简称“中译语通”)联合天津大学作为大模型核心起草单位参与了《大规模预训练模型技术和应用评估方法 第一部分:模型开发》、《大规模预训练模型技术和应用评估方法 第二部分:模型能力》的标准编制工作。

WechatIMG51.png

大模型标准核心起草单位之一中译语通

同时,由“天津大学—中译语通自然语言处理联合研究中心”研制的“基于混合专家模型的大规模多语言机器翻译”成功入选“2022大模型预训练模型优秀应用案例”,在创新性和实践应用上获得了评选组的认可。

5dc5895c3b447cda521285a7f758709.jpg

“基于混合专家模型的大规模多语言机器翻译”
入选2022大模型优秀应用案例

图片1.png

首批入选2022大模型优秀应用案例的名单

基于混合专家模型的大规模多语言机器翻译

当前行业的大多数机器翻译系统局限于单一模型实现单个语言对的翻译,“多语言机器翻译”可以实现使用一个模型处理多种语言之间的互译,节省用户部署成本的同时,可以利用在富资源语言上学习的知识提高在低资源语言上的翻译效果。一个多语言机器翻译模型可以处理的语种数量可达上百种,训练模型的平行语料数据可达百亿句对。大规模模型、大规模语种、大规模训练数据给多语言机器翻译的研究和应用带来了严峻的科学与技术挑战。

“基于混合专家模型的大规模多语言机器翻译”,利用混合专家(MoE)技术和中译语通大规模多语种平行语料,训练了百亿参数规模的多语言机器翻译模型。使用混合专家技术训练的大规模多语言机器翻译模型,相比于常用的Transformer模型,翻译效果得到显著提升。同时,提出了一种高效的通信优化策略,在保持翻译效果不变的情况下,将模型的训练速度提升了30%以上。

天津大学—中译语通自然语言处理联合研究中心

“天津大学—中译语通自然语言处理联合研究中心”是由中译语通和天津大学共同创建的联合实验室,由天津大学熊德意教授担任联合实验室负责人。实验室定位于机器翻译、自然语言处理、语言大模型等基础和应用技术研究,共同开展关键技术研究、项目联合申报、联合人才培养、国际与行业影响力提升等工作。


扫描二维码分享到微信

联系我们