百度吴甜:“文心大模型”开发者数量超6万人

百度吴甜:“文心大模型”开发者数量超6万人
文章图片

文章图片

自从OpenAI发布GPT-3之后 , 大模型成为几乎所有全球头部人工智能(AI)公司的逐鹿目标 。
钛媒体App4月19日消息 , 百度集团副总裁吴甜近日接受钛媒体App等采访时表示 , 百度产业级知识增强大模型“文心” , 目前已经大规模应用于百度内部的各类产品 , 包含搜索、信息流、小度智能屏、百度地图等 。而“文心大模型”的个人、企业开发者数量已超过6万人 。
吴甜强调 , “今年是文心大模型产业落地关键年” 。
【百度吴甜:“文心大模型”开发者数量超6万人】据悉 , “大模型”是目前世界AI研究领域最热门的话题之一 。AI技术发展到今天 , GPT和BERT等参数量巨大的模型被人们开发出来 , 他们在计算机视觉和自然语言处理等领域取得了前所未有的成就 。
随着数据井喷、算法进步和算力突破 , 泛化能力和通用性强的预训练大模型 , 正在成为AI技术发展的关键方向 , 并成为AI产业应用的重要推动力 , 有望让AI技术与各行各业的差异化场景深度融合 , 让大部分企业的标注数据更少、开发效率更高、应用成本更低 , 从而大幅降低AI的应用门槛 。
2019年3月 , 百度发布中国首个正式开放的预训练模型ERNIE1.0;2021年12月 , ERNIE3.0升级为知识增强千亿大模型“鹏城-百度·文心” , 模型参数规模达到2600亿 , 是目前全球最大中文单体模型 。
同时 , 2021年12月发布全新的文心大模型全景图 , 文心大模型家族包含NLP(自然语言理解)大模型、CV(计算机视觉)大模型、跨模态大模型 , 以及工具与平台 。
在吴甜看来 , “文心大模型”作为产业级大模型 , 核心价值在于驱动AI技术的规模化应用 。
因此 , 为了进一步降低应用难度 , 百度还为“文心大模型”开发易上手、轻量化的部署工具平台 , 包括提供各类开发套件 , 零门槛AI开发平台EasyDL、全功能AI开发平台BML等 , 让不同群体都能低门槛实现AI技术应用 。
吴甜表示 , 通过百度AI开放平台 , 现在已经有近1400项能力是开放给企业开发者使用的 。
吴甜对钛媒体App表示 , 基于百度飞桨平台与百舸集群 , “文心大模型”在算法、框架、算力层面实现了自主创新 。通过大模型与国产深度学习框架融合发展 。支撑“文心大模型”训练的是百度飞桨平台自主研发的端到端、自适应、分布式训练框架与4D混合并行技术 。百度已经构建出自主创新的AI基底 , 能驱动AI规模化应用 。
目前 , “文心大模型”已通过飞桨平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业落地应用 。其中在智能制造场景中 , 大模型可应用于质检、巡检这一类型以计算机视觉场景 , 以及数据设备的运维等自然语言处理场景当中 。
具体案例方面 , 百度与中国人寿合作 , 针对保险合同中条款文本进行关键字段的提取 。基于文心大模型 , 实现了保险合同条款的智能解析 , 自动提取近40个维度的关键字段 , 业务处理效率大幅提升 。
“基于企业自己积累的标注信息 , 然后用‘文心大模型’与此前数据一起进行二次训练 , 会帮助客户做一些数据增强工作 。再通过多次客户反馈构造数据 , 进行模型迭代 , 就达到实用状态了 。”吴甜对钛媒体App表示 , 真正使用时 , 把大模型的能力嵌到私有云当中 , 在保险人员的工作流中嵌入一个功能 , 告诉他一些分析后的建议 , 然后基本上可以快速上手使用“文心大模型”能力了 。