
图1. 疏散星团 NGC2632(Copyright: Stuart Heggie)
疏散星团不仅是银河系结构和演化的示踪天体,也是研究恒星形成与演化的理想实验室。Gaia 任务发布的海量数据极大地扩展了已知的疏散星团数量,然而,这也带来了一个棘手的挑战:在通过聚类算法筛选出的数千个候选星团中,混杂着大量由场星随机涨落导致的“假阳性”信号。近日,NADC青年数据科学家、中国科学院上海天文台李璐博士领导的研究团队,基于自主研发的“疏散星团混合模型(MiMO)”,提出了一套基于测光贝叶斯证据(Photometric Bayesian Evidence)的星团物理验证新框架,为在大数据时代从海量候选者中“去伪存真”提供了强有力的定量化工具。
在传统的研究中,验证一个星团候选者是否真实存在,通常依赖于天文学家目视检查其颜色-星等图(CMD),看其是否呈现出明显的“等龄线”特征。然而,这种基于经验的判断方式不仅难以避免主观认知的人为偏差,更缺乏定量的评判标准 。特别是对于那些特征模糊的候选体,仅凭肉眼很难判断CMD上的弥散分布究竟是来源于被观测误差和双星展宽的真实星团,还是仅仅源于由于视线方向上场星的随机组合。因此,为了确保样本的纯度与科学结论的可靠性,我们迫切需要一种统计学严谨的定量验证方法 ,用客观的计算结果取代主观直觉,从数学层面上厘清候选体究竟是真实的物理系统,还是随机的统计涨落。

图2:不同类型天体的颜色星等图对比。左图为随机场星样本,中图为特征模糊的候选体,右图为拥有高置信度的真实疏散星团(橙色点为样本恒星,灰色背景为场星模型)。
针对这一难题,研究团队利用 MiMO 模型的贝叶斯框架,将“星团候选体验证”转化为一个严格的统计模型比较问题:即比较观测数据是更支持“单星族(星团)+场星”的混合模型,还是更支持“纯场星”模型。这两个模型证据的比值,即贝叶斯因子(Bayes Factor, BF),直接量化了星团存在的统计学支持强度。

研究团队利用600个随机场星样本和1232个已确认的疏散星团进行了大规模测试。结果显示,贝叶斯因子能够极好地分离真实星团与虚假信号。研究发现,log10(BF) > 2(即贝叶斯因子大于100)是一个稳健的物理判据,意味着“星团+场星”模型的可能性至少是“纯场星”模型的100倍。这一阈值能够有效剔除绝大多数随机场星的统计涨落,同时保留真实的星团信号。

图3:贝叶斯因子对真实星团与虚假信号的显著区分能力。蓝色直方图代表已确认的真实疏散星团,橙色代表模拟的随机场星样本。虚线标示了了log_10(BF) = 2 的判定阈值。结果显示,该物理判据能有效将真实的物理系统与随机的背景涨落分离开来。
与传统的信噪比或拟合优度指标不同,贝叶斯因子即使在场星污染极高(污染率 > 70%)的情况下,依然能敏锐地捕捉到隐藏其中的星团信号,展现出极强的鲁棒性。这一新方法不仅适用于疏散星团的清洗与提纯,其基于混合模型比较的通用框架还可广泛应用于星流、移动星群以及银河系卫星星系等其他可分辨恒星系统的验证。
此项研究成果已于2025年11月正式发表在国际天文学期刊《天体物理学杂志》(The Astrophysical Journal)上 。论文第一作者兼通讯作者为上海天文台李璐博士,合作者包括南京大学李昭洲教授和上海天文台邵正义研究员等。为了推动社区复现与应用,MiMO 代码已通过国家天文科学数据中心(NADC)发布。
论文链接: https://iopscience.iop.org/article/10.3847/1538-4357/ae17ce
代码链接: https://nadc.china-vo.org/res/r101693/
联系人: 李璐 lilu@shao.ac.cn