新药研发利器:复旦AI预测蛋白质侧链精度超越谷歌“阿尔法折叠”

谷歌旗下深度思维公司研发的“阿尔法折叠2”系统(AlphaFold2) , 实现了人工智能预测蛋白质结构的突破 。如今 , 复旦大学在人工智能预测蛋白质侧链结构的精度上 , 超越了“阿尔法折叠2” 。今天 , 介绍“作品折叠”系统(OPUS-Fold)算法的论文在线发表于英国《生物信息学简报》 , 这项成果为新药研发提供了利器 。
虽然在社会知名度上 , “阿尔法折叠2”不如战胜世界冠军的“阿尔法围棋”(AlphaGo) , 但它的科技价值远超后者 。去年11月 , “阿尔法折叠2”在国际蛋白质结构预测竞赛上夺冠 , 其预测精度非常接近实验测定水平 , 被美国《科学》杂志评为2020年十大科学突破之一 。
用人工智能系统预测蛋白质结构 , 有什么价值?复旦大学复杂体系多尺度研究院教授马剑鹏说 , 蛋白质由一系列氨基酸折叠而成 , 具有稳定的三维结构 。如果掌握了各种蛋白质的精确三维结构 , 科学家在生命科学研究中就好比有了导航地图 。然而 , 用冷冻电镜等实验设备测定蛋白质结构的难度很大 , 而且经济成本、时间成本很高 。如果人工智能系统可以快速、精准地预测蛋白质结构 , 新药研发等工作的效率将大幅提高 , 成本也会随之降低 。
【新药研发利器:复旦AI预测蛋白质侧链精度超越谷歌“阿尔法折叠”】
新药研发利器:复旦AI预测蛋白质侧链精度超越谷歌“阿尔法折叠”
文章图片

文章图片

复旦大学复杂体系多尺度研究院
蛋白质三维结构由主链和侧链共同搭建而成 , 人工智能系统预测蛋白质结构的步骤 , 是先为蛋白质主链建模 , 再根据主链的构象为侧链建模 。自然界中的蛋白质含有20种氨基酸 , 它们的主链几乎完全相同 , 但侧链差异很大 。药物分子与人体蛋白质的结合大多通过与氨基酸侧链相互作用来实现 , 所以人工智能系统对侧链结构的精准预测 , 对新药研发具有重要价值 。这种预测能力还可用于解释基因点突变、基因小片段突变的机制 , 为遗传性疾病研究和治疗提供思路 。值得一提的是 , 这种对基因的点突变或小片段突变的结构建模能力 , 是“阿尔法折叠”及类似的结构预测算法所不擅长的 。
近年来 , 马剑鹏团队运用人工智能技术研发出“作品折叠”系统 , 用于预测蛋白质主链和侧链的三维结构 。今天发表的论文显示 , 基于“阿尔法折叠2”在国际蛋白质结构预测竞赛上预测的多个蛋白质主链结构 , 重新预测其侧链结构 , 再与实验测定的结构比对 , “作品折叠”预测侧链结构的精度比“阿尔法折叠2”高13% , 成为这个领域的世界冠军 。

新药研发利器:复旦AI预测蛋白质侧链精度超越谷歌“阿尔法折叠”
文章图片

文章图片

蓝色为蛋白质侧链天然构象 , 红色为OPUS-Fold预测结果 。
“这是一个了不起的突破 。”诺贝尔化学奖得主、复旦大学复杂体系多尺度研究院名誉院长迈克尔·莱维特表示 , 研究院计划对“阿尔法折叠2”预测的2万多个人类编码基因对应的蛋白质结构进行“改造” , 为其侧链结构重新建模 , 并向全球学术界开源 , 推动生命科学发展 。
复杂体系多尺度研究院还希望与国内产业界合作 , 利用“作品折叠”推动新药研发进程 。上个月 , 谷歌母公司Alphabet宣布成立人工智能制药公司 , 利用“阿尔法折叠”研究新药 , 正反映了这一科技成果转化趋势 。“我们会加快研发、迭代人工智能制药领域的基础软件 , 力争推动生物医药产业变革 。”马剑鹏说 。