【成果】基于集成网络的脉冲星候选体筛选技术应用于FAST漂移扫描巡天

来源:作者:郭平 发布时间:2020-04-21 浏览次数:748

我院图形图像与模式识别实验室(IGPR)郭平教授课题组在人工智能与天文学交叉研究领域取得重要进展。

在天文学领域,1967年英国天文学家Hewish和他的研究生Bell一起发现了脉冲星, 验证了物理学家30年前预言——宇宙中存在中子星。在此之后的二十多年的时间里,有关脉冲星的研究两获诺贝尔物理学奖。脉冲星为我们提供极端条件下的物理实验室。脉冲星可以作为宇宙中星际介质的探针,可以用于脉冲星计时,还可以用来验证引力波的存在。因此,脉冲星的研究具有重要的学术价值,开展脉冲星搜寻具有重要意义。

我国自主设计并建造了世界上最大的单口径望射电远镜——FAST (Five-hundred-meter Aperture Spherical Telescope),正在开展多科学目标同时扫描巡天(Commensal Radio Astronomy FasT Survey)。计划使用漂移模式下的FAST 19波束L波段接收机对FAST的可见天区进行中性氢观测和脉冲星搜寻。采用漂移扫描模式每晚将产生超过一百万颗脉冲星候选体,如此庞大的候选体数量不可能完全依靠人工完成脉冲星筛选。FAST采用漂移扫描巡天模式,会产生特有的脉冲星候选体。此外,FAST的射电干扰环境也不同于其他望远镜。因此,发展新的脉冲星候选体筛选方法是开展大规模脉冲星巡天的关键。

我们发展了一系列人工智能应用技术支持FAST脉冲星搜寻的任务,包括基于生成对抗网络的技术,以及本工作中的群体智能技术。群体智能(Swarm Intelligence)是计算智能里的一个研究领域,是智能形态高级的表现方式之一,在本工作中具体呈现为群体集成学习中的堆栈泛化(Stacked Generalization)技术。这项我们称之为PICS-ResNet的技术能够实现bias和variance的平衡,具有较好的鲁棒性。通常用于脉冲星候选体识别的判定图中包含四个子图,分别是:时间与相位和频率与相位二维子图、脉冲轮廓和DM曲线一维子图。这些子图是人工筛选脉冲星时的重要依据,也是作为机器学习模型识别的重要特征图。我们所提出的模型继承了PICS(Pulsar Image-based Classification System)模型的双层结构,在第一层基学习器中分别利用15层深度残差神经网络(ResNet)识别二维子图,利用SVM识别一维子图。然后将各分类器的识别结果输入到第二层的元学习器(逻辑回归模型)中,输出最终的分类结果。该模型利用CPU和GPU并行运行,因此该模型与PICS模型相比具有更高的运行效率。通过在GBNCC和FAST数据集上测试,表明该模型具有更好的鲁棒性。


 

Figure 1 Diagram of the PICS-ResNet model.


 

Figure 2 Generalization test using the GBNCC dataset (PICS-ResNet and PICS recall curves)


上述研究成果于2019年5月作为FAST首批成果发表于物理类1区top期刊SCIENCE CHINA Physics, Mechanics & Astronomy。该工作由北京师范大学与中科院国家天文台合作完成, 论文第一作者王洪丰是郭平教授指导的计算机学科的在读博士生,研究方向为基于机器学习的脉冲星候选体识别。该研究得到了国家自然科学基金委员会与中国科学院天文联合基金重点支持项目(U1531242)等国家自然科学基金面上项目以及中国科学院战略性先导科技专项的资助。


论文链接:H. F. Wang, W. W. Zhu, P. Guo, et al. Pulsar candidate selection using ensemble networks for FAST drift-scan survey, Sci. China-Phys. Mech. Astron. 62, 959507 (2019) , https://link.springer.com/article/10.1007/s11433-018-9388-3.