百度飞桨与英特尔openvino共创ai推理新高度( 二 )

百度飞桨与英特尔openvino共创ai推理新高度
文章图片

文章图片

除此之外 , 英特尔也通过联邦学习、英特尔SGX等技术 , 来满足用户在数据保护方面的诉求 。
面向前沿的大模型研究 , 百度与英特尔从训练到部署等各环节均有合作 。除了在英特尔CPU上的基础性能优化工作外 , 百度飞桨还充分利用了英特尔在低精度计算、量化计算、支持构建多级参数存储机制的持久内存等方面的能力 , 来更大程度提升大模型的训练和推理性能 。
于佃海提到百度飞桨现在做的比较多的是自动化压缩技术 , 不必依赖于训练代码 , 并具备硬件自动感知能力 , 来实现更好的量化和裁剪等方面的压缩 。百度也将自适应分布式计算的技术迁移到推理环节来实现对大模型更好的支持 。
二、边缘AI发展三阶段:自主学习是终极议题
谈及OpenVINO的演进 , 张宇说 , OpenVINO面对的场景范围更加宽泛 , 从视频图像拓展至语音、文字的处理 , 并将继续拓展其覆盖领域 , 涵盖更多行业的AI应用需求 。
在他看来 , 边缘AI的发展可以分为三个阶段:第一个阶段是实现边缘推理 , 第二个阶段是实现边缘训练 , 第三个阶段是实现在边缘的自主学习 , 即只需告诉机器大致意图 , 机器就能自主选择一个最适合的网络模型 , 用相应的数据去训练这个模型 , 然后将该模型部署在生产环境中 。
因此 , 他希望OpenVINO后续能在边缘训练方面帮助开发者解决一些实际问题 , 更长远地在边缘AI自主阶段发挥一定作用 。
张宇认为 , 目前AI处于一个实验科学的阶段 , AI模型仍像一个黑盒子 , 在理论基础方面还有较大欠缺 , 学术界还无法真正做到“可解释性” , 要突破自主学习 , 则需实现理论突破 。
于佃海亦谈道 , 在很多的应用场景中 , 当下的AI还是在解决一些有限范围内的问题 。但近两年兴起的“AI+科学” , 利用深度学习对于复杂数据处理、高维非线性函数拟合的能力 , AI技术正逐渐深入到物理、化学、材料、生物、医学等领域的科学问题求解中 , 去辅助科学家探索一些开拓性的科学规律 , 加速科研创新 。
例如 , 英特尔通过oneAPI对DeepMindAlphaFold2进行逐个模块的加速 , 为其带来预处理的高通量优化和架构之外的模型推理优化 , 从而提高蛋白结构分析和大数据测序的效率 。
在生物计算领域 , 百度飞桨已经做了一些探索的工作 , 如在化合物和蛋白质的表征上融合生物学知识 , 将化合物几何结构引入自监督学习范式和分子表示模型 , 并在下游十多项的属性预测任务中取得当下最好结果 , 相关成果登上了Nature子刊 。
英特尔和百度工程师还在分子动力学(MD)领域共同研发 , 基于英特尔oneAPI和第三代英特尔至强可扩展处理器 , 并利用深度学习加速技术AVX512指令集 , 优化分子动力学模型 , 以有效提升用户深度学习应用的工作效率 。目前该产品已开放测试 , 以期赋能材料研发工作 。
张宇提到英特尔持久内存在确保足够存储容量的同时 , 极大提高了读写速度 , 并能满足平台在处理像分子动力学这样的复杂模型过程中对于算力和存储提出的综合要求 。
不过 , 于佃海强调道 , “AI+科学”领域的很多成功应用 , 更多体现在比传统方法更加高效 , 但AI如何辅助发现更多科学规律、提供更多启发 , 仍具有挑战性 。
三、科技向善 , 解析“AI+科学”三大挑战
“我们想和英特尔一起做出一个世界领先的高性能解决方案 。”于佃海说 , 在分子动力学领域 , 他们当下的工作是希望让计算更大幅度提速、性能更加优化 , 这本身就存在诸多挑战 。