数量|FAST首席科学家:AI是天文学重要工具,寻脉冲星难在哪

2020年1月 , 被誉为“中国天眼”的500米口径球面射电望远镜(FAST)启动运行以来 , 中国天文学在脉冲星的观测研究上 , 有了长足的进步 。 据国家天文台3月发布的消息 , 自通过国家验收启动运行以来 , 中国天眼FAST设施运行稳定可靠 , 发现的脉冲星数量已达到300颗 。
为什么脉冲星如此重要?据新华社此前的报道 , 脉冲星是一种快速旋转的中子星 , 由恒星演化和超新星爆发产生 , 可用于引力波探测、黑洞等相关研究 , 这有助于解答许多重大物理学问题 。
不过 , 即使有了中国天眼FAST的加持 , 寻找脉冲星也不是一件简单的事儿——据中国青年报1月份的报道 , FAST在2018年观测时 , 峰值数据率每秒就可以达到38G 。 其产生的海量数据 , 给FAST团队带来了巨大挑战 。
面对海量的数据 , 如同大海捞针一般的搜索过程 , 人工智能或许可以发挥作用 。
7月9日 , 在2021世界人工智能大会期间 , 腾讯与国家天文台合作的“探星计划”宣布正式启动 , 双方将基于优图实验室计算机视觉技术、腾讯云的计算及存储能力 , 帮助中国天眼FAST提升脉冲星搜索效率 , 并辅助快速射电暴和近密双星系统中脉冲星搜索 , 助力天文探索 。
AI如何帮助天文学家寻找星星?如果没有AI , 寻找脉冲星这个活儿 , 是如何实现的?寻找到脉冲星后有什么用?中国科学院国家天文台研究员、FAST首席科学家李菂在接受澎湃新闻在内的媒体采访时做出介绍 。
并非像大众想象的那么“原始” , 据李菂介绍 , 实际上 , AI已经是天文学研究的一项基础工具 。 “AI现是一个非常基础的重要的工具 。 我们现在前沿很多课题是因为有AI的能力才这么设计的 。 ”李菂说 , “比如原来对电磁场的采样 , 30年以前的项目和现在的项目是完全不一样的 , 那时候的科学家和工程师要根据那时候的能力来设计项目 , 所以我们现在一开始坐在这儿想这个项目的时候 , 已经把我们有可能用到的技术算进去了 。 ”
李菂表示 , 问天文学使不使用机器学习、深度学习等人工智能技术 , 就好像问“20年前天文学用不用电脑一样” , 这些技术用得很多 。
但真正遇到的挑战是 , 在李菂的团队里 , 虽然已经在普遍地使用AI , 但一般只能用公开可以拿到的现成工具 , 目前没有真正能够做AI开发的人 , “即使是能够去学一下新的技术 , 这样的人可能也就四、五个 。 ”
据统计 , 天眼FAST在1周内产生的数据大约相当于3000万张信号图 , 如果以人工肉眼处理 , 按照1张/秒速度 , 在不吃不喝不休息的条件下 , 需要用一年的时间才能处理 。
“一天多少个T的数据 , 靠一个人或者一个小团队 , 显然是有问题的 。 ”李菂说 。
中国天眼FAST所产生的数据 , 也就是AI需要处理的信号图具体都有什么内容?据李菂介绍 , 信号图是多种特征的组合 , “数据是对电磁场的高速采量 , 在这上面做信号处理和频谱分析 , 得到的是一个视频 , 就是动态谱 。 一个维度是时间 , 一秒钟700转 , 有1万个点 。 另一个维度是频率 。 ”李菂称 , “这个东西人眼是没办法处理的 , 因为太快了 。 1秒钟1万谱 , 从你眼前闪过去了 。 (所以)我们处理的大多数情况是照片 , 把它截出来 。 截出来以后可能量还是太大了 , 所以要做进一步的信息提取 。 ”

数量|FAST首席科学家:AI是天文学重要工具,寻脉冲星难在哪
文章图片

复杂的图像数据
巨大的数据量 , 却正好是云和人工智能的最佳试验场 。
今年初 , 主攻计算机视觉领域的腾讯优图实验室几位天文爱好者提出 , 可以将计算机视觉技术用于天文学中对脉冲星的搜索 。 在联系到国家天文台后 , 很快达成了合作意向 。 “我们会用机器学习的方式来寻找疑似样本 , 再交给专业的人员看是不是我们真正发现了信号 。 ”腾讯优图实验室副总经理黄飞跃介绍 。
在云和AI的辅助下 , 脉冲星搜索效率将得到显著提升——前述数据的处理 , 如果通过AI预筛选 , 只需要3天时间就可以完成 。
黄飞跃介绍 , AI探星的难点在于 , 过去做深度学习最核心的是要有海量的已经标注的数据作为训练数据 , 以优化和调整模型 , 但天文领域有标注的训练数据相对偏少 , 因此用来训练时存在难度 。 此外 , 不同型号的观测设备所得到的数据、展现形式各异 , 也增加了数据处理的难度 。
对于缺少标注的数据 , 黄飞跃称 , 该团队采用了“自监督的学习方法” , 对于不同场景和设备的数据 , 则引入了“跨域学习”的技术 。 最终的效果是效率和准确率都有了比较大的提升 。
“这个阶段进行得很快 , 最近已经有脉冲星的发现 , 这是实打实的科学成果 , 我们还是非常兴奋的 。 ”据李菂透露 , 与腾讯合作以来 , 已经新发现了5颗脉冲星 。
在“捕捉”到脉冲星以后 , 具体要研究它的什么信息?李菂告诉澎湃新闻采访人员 , “先要测量它的时间特性 , 还有它辐射的特性 , 它在一个周期里强度是怎么变化的 , 这个蕴含了星体周围的条件 。 ”
“还有一个比较有意思的是:(脉冲星的)信号穿过星际空间 , 星际空间不完全真空 , 还有电子 , 就像光穿过水一样 , 会有折射 。 折射在我们这个领域叫做射散 , 因为不同频率的光速度不一样 , 这样会产生类似于声波的多频效应 , 高频的信号先到 , 低频的信号后到 。 通过处理 , 我们可以得到特征 , 通过这个特征继续反推星际空间中存在的物质 。 ”《自然》就曾对2021年最值得关注的科学事件做出预测称 , 脉冲星将助力探测引力波 。
李菂将脉冲星的研究在天文学中的地位 , 比作人工智能技术的发展 。
可见的是 , 随着大数据、云计算等的发展 , 人工智能技术的研究与应用显著加速 。 而观测设备的升级 , 让脉冲星的发现步伐也大大加快 。 人工智能成为各行各业的助手 , 而脉冲星也成为人们研究宇宙的支点 。
【数量|FAST首席科学家:AI是天文学重要工具,寻脉冲星难在哪】(本文来自澎湃新闻 , 更多原创资讯请下载“澎湃新闻”APP)

    推荐阅读