时域光变基础模型FALCO研究成果正式发表
发布时间:
2025-12-15 16:52
修改时间:
2025-12-15 16:51
文章类别:
阅读次数:
51

近日,来自中国科学院国家天文台、国家天文科学数据中心、中国科学院大学、之江实验室、西湖大学、俄亥俄州立大学等国内外科研机构组成的合作团队在国际学术期刊The Astronomical Journal(AJ) 发表了题为”FALCO: Foundation model of Astronomical Light Curves for time dOmain astronomy. Implementation and Applications on Kepler data” 的研究论文。国家天文台/国家天文科学数据中心博士研究生左肖雄为第一作者,国家天文台/国家天文科学数据中心陶一寒博士、中国科学院大学黄样副教授、之江实验室陈华曦高级工程专家、国家天文台/国家天文科学数据中心崔辰州研究员为共同通讯作者。论文链接:点击这里。

面向时域巡天海量光变数据分析的多样化科学需求,研究团队提出了FALCO时域光变基础模型, 探索从单一任务向多任务通用模型的范式转变。 本论文是此项研究计划的首个实践成果,AJ审稿人评价这项工作“具有算法创新性和充分的有效性验证,是基基础模型构建的重要实践,能够降低技术门槛,让计算资源有限的科研团队也能从中受益”。研究团队核心成员来自国家天文科学数据中心,充分展示了中心在推动天文学研究数智化发展中的重要作用。

图1  FALCO研究路线图

随着新一代大规模时域巡天项目的推进,时域天文学研究面临着海量数据分析挖掘的关键挑战。传统模型往往依赖大量人工标注数据、且通常针对单一任务设计,泛化能力有限,难以满足多样化科学需求。

为此,研究团队提出了FALCO(Foundation model of Astronomical Light Curves for time dOmain astronomy)——时域光变基础模型,旨在通过自监督预训练建立光变数据通用表征,实现多任务统一分析。首个版本模型基于 Transformer 架构,利用Kepler巡天观测的17万条光变曲线进行自监督预训练,能够捕捉光变序列的结构特征。通过变星分类、参数估计和耀发识别等多个基准任务的评估,研究验证了模型的有效性和跨任务泛化能力。实验结果显示,模型规模越大、输入序列越长,性能提升越显著,符合深度学习中的规模定律(Scaling Law)。具体应用效果:

  • 变星分类:在八类变星分类任务中,模型准确率达到95%;
  • 恒星表面重力(log g)估计:整体均方根误差(RMSE)为0.13 dex,在低重力区(log g < 1)精度优于 0.08 dex,逼近星震学测量水平;
  • 恒星耀发识别:识别精度达87%,可有效检测短时爆发事件。

同时,研究团队利用模型给出了覆盖 179,732 颗 Kepler目标的 log g 参数星表,已通过国家天文科学数据中心(NADC)发布(DOI: 10.12149/101577)。

图2 模型架构示意图

目前,FALCO模型已集成至国家天文科学数据中心建设的天文大模型平台(https://nadc.china-vo.org/ai)。用户可通过上传Kepler光变曲线或输入目标编号,在线进行变星分类、log g 估计和恒星耀发识别等分析。此外,研究团队计划通过NADC科学平台(https://science.china-vo.org)发布经模型处理后生成的嵌入表示(Embedding),即编码后的向量,可在JupyterLab环境中灵活调用开展分析任务。

图3  NADC天文大模型平台应用示例

未来,团队将在更多时域巡天项目数据上扩展FALCO模型,进一步提升其在时域天文多场景中的适用性。

本研究获得国家重点研发计划、国家自然科学基金及之江实验室重大科研项目的资助。研究工作得到了之江实验室的算力支持。

 

)
Yang Hanxi
(文章编辑:
我们使用cookies为您提供更好的体验。继续使用本网站,即表示您同意按照我们的Cookie 政策使用cookie。
接受