商汤进军AI制药研发,力求“更快、更高、更强”( 二 )


商汤进军AI制药研发,力求“更快、更高、更强”
文章图片

文章图片
△图片来自视觉中国
【商汤进军AI制药研发,力求“更快、更高、更强”】问:AI+药物研发和AI+医学影像 , 最大的不同点是什么?
答:不同点主要有两个方面:
从应用层面来看 , AI+医学影像的主要研究目的 , 是帮助在日常工作中通过使用医学影像进行诊疗的医生提升工作效率或者精度 , 解决他们能做却费力、或者需要对较低年资医生进行培训的问题 , 比如AI辅助诊疗能够帮助医生进行肺部CT的诊断、或者辅助肝脏外科医生进行基于CT的三维术前规划 。然而 , 在药物研发领域 , AI要解决的问题更具前瞻性 , 多是行业目前还不能解决的问题或是还未被发现的前沿领域 , 例如AI辅助新靶点的定位、蛋白与药物的全新相互作用关系的发现等等 。在这类场景下 , AI要解决的是在茫茫未知银河中人类相对没有经验的问题 , 因而研发的未知性和潜力也更大 。
从技术层面来看 , 医学影像相对而言数据模态比较简单 , 不管是X-ray、CT、MRI还是病理 , 都是分析二维或三维的图像数据 , 用的大多是行业内比较成熟的卷积神经网络来训练 。然而 , 对于药物研发而言 , 数据复杂度会大幅上升 , 研究的是分子、蛋白、药物等多种对象 , 以及对象与对象间的相互连接关系 , 是一个复杂的网状结构 。在这样的背景下 , 我们多采用的是图神经网络 , 这个技术以往较多用在分析社交网络的复杂海量数据 。对于图神经网络这个技术分支 , 我们做了很多创新尝试 , 比如在针对临床前蛋白药物关系的研究中 , 我们将药物分子的各个原子看作节点 , 将药物分子视为一个图 , 运用图神经网络进行微观层次的建模;针对老药新用的问题上 , 我们又把分子、蛋白、疾病看成不同的节点 , 通过进行宏观网络建模 , 研究相互间的复杂关系 。
问:商汤智慧健康在AI+药物研发这个新方向上有什么优势?
答:商汤的优势在于“更快、更高、更强” 。
更快 , 体现在算力、算法和平台三者的有效联接 。药物、基因等生物组学的数据规模非常大 , 对于计算资源要求极高 , 如何加速对海量大数据的计算和建模 , 能够直接影响AI+药物研发的效率 。商汤前瞻性打造的新型人工智能基础设施——SenseCore商汤AI大装置 , 能够打通算力、算法和平台 , 大幅降低人工智能生产要素价格 , 实现高效率、低成本、规模化的AI创新和落地 。商汤AI大装置算力层以商汤智算中心为基础 , 该中心是目前亚洲最大的人工智能算力中心 , 总算力可达3,740 Petaflops(1 Petaflop等于每秒1千万亿次浮点运算) , 1天内可处理时长23,600年的视频 , 能够提供强大的算力基础 , 支撑对海量数据和算法模型的分析、训练和推理 。
更高 , 体现在算法能力上 。商汤有着业界顶尖的原创算法能力 , 在过去六年中 , 商汤科技共发表440多篇关于深度学习和计算机视觉的研究论文 , 排名全球第一 , 领先微软 , 谷歌 , Facebook , 及其他科技公司、领先的研究型大学 , 而这其中的很多基础算法是通用的 , 可以应用在药物AI研究 。此外 , 在全球知名知识产权媒体IPRDaily公布的2020全球智慧医疗-AI医学影像辅助诊断发明专利排行榜中 , 商汤也以536件公开专利申请数量位居全球第五 , 其中也包含多项基因分析、药物研发相关的专利 。具体到研究过程 , 例如我们在做一个AI基因分析项目时 , 需要处理的患者全基因组数据包含的位点达30亿个 , 每个位点一般会测几十次 , 所以单个患者的数据可能就会达到100G之多 , 传统方法的计算时间长达十个小时 。在商汤超高性能的算力基础之上 , 我们也通过原创的算法将计算时间缩短到十几分钟 , 将计算效率提升超过27倍 , 极大的提升了建模、数据处理的效率 , 从而可以快速推动药物研发务进展 。