2022世界人工智能大会|看图更准,能理解视频和做翻译的“书生2.0”来了( 二 )


M2M和NLLB是公认开源效果领先的多语言翻译模型 。在Flores数据集上 , 对比M2M 120亿参数量模型 , “书生2.0”在多语到中文的平均翻译性能提升了35.1%;对比NLLB 500亿参数量模型 , “书生2.0”在多语到中文的平均翻译性能提升了7.1% 。而相较前两者 , “书生2.0”仅需要10亿的推理参数 。以“书生”技术为支撑 , 团队在Waymo自动驾驶等16项国际大赛和评测中取得了冠军 , 发表了20余篇高质量学术论文并开源 , 稳步构建以视觉和自然语言为核心的更为通用的人工智能技术体系 。
本次大会期间 , 由中国电子技术标准化研究院、上海人工智能实验室联合发起 , 多家机构共同编撰的全国信标委人工智能分委会的第一份技术文件《人工智能大规模预训练模型 第1部分:通用要求》(TC28/SC42-001)也即将发布 。该文件是模型开发者、科研机构、模型使用方、第三方评测机构共同研讨的重要成果 , 作为我国大模型领域的一份奠基性规范文件 , 对推动大模型与产业深入融合、完善生态具有重要意义 。