“如何从5亿只狗里把混入的几只猫挑出来?” 紫台最新研究成果:利用机器学习“大海捞针”( 二 )


打了个比方 , 就好比在日常生活中经常需要进行“人脸识别” , 这其中就用到了机器学习方法 。天文学家的工作就相当于要训练一个能从5亿多只的狗群里把几只猫挑出来的机器 。当然 , 快速射电暴不管从形态上 , 还是训练样本的收集上都比猫和狗要困难 。
“如何从5亿只狗里把混入的几只猫挑出来?” 紫台最新研究成果:利用机器学习“大海捞针”
文章图片

文章图片
来源视觉中国
筛选出81个新的快速射电暴候选体
最终 , 团队运用训练好的模型 , 从数据库里找出了81个新的快速射电暴候选体 。“这次发现一次性增加了81例 , 不仅有了数量上的突破 , 并且解决了以往对于暗弱快速射电暴的搜寻难题 。为大样本 , 大数据难题下的数据处理问题提供了一个解决方法 。”张松波说 , 如今全球正在建设更多、更大的新的射电望远镜 , 中国500米口径球面射电望远镜(FAST)、澳大利亚平方公里阵探路者望远镜(ASKAP) , 以及正在建设中的平方公里阵列望远镜(SKA)都正在或即将展现更高的灵敏度 , 同时也将带来更为惊人的数据量 。
“如何从5亿只狗里把混入的几只猫挑出来?” 紫台最新研究成果:利用机器学习“大海捞针”
文章图片

文章图片
银道坐标系下帕克斯望远镜观测天区的空间分布图 。橙色星号展示了81个快速射电暴候选体的分布
“未来的天文观测必将是大数据的时代 , 人工智能则是最可行的解决方案 。”张松波说 , 随着望远镜技术的不断发展 , 我们接收宇宙中信号的能力越来越强 , 这意味着我们所得到的数据越来越多 。而天文学中的很多信号往往具有复杂的结构 , 靠人为设置条件筛选已经无法满足日益增长的海量数据 。机器学习能够从包含复杂干扰的图片中找到来自宇宙的真实信号 , 极大地加速了的研究速度 。
“如何从5亿只狗里把混入的几只猫挑出来?” 紫台最新研究成果:利用机器学习“大海捞针”
文章图片

文章图片
中国“天眼”来源视觉中国
该论文第一作者为杨轩 , 通讯作者是张松波和吴雪峰 。此项工作得到了中澳合作项目ACAMAR博士后计划 , 以及国家自然科学基金委杰出青年项目和FAST专项项目等基金资助 。
扬子晚报/紫牛新闻采访人员于丹丹
校对李海慧