1. 项目概述与核心挑战在恒星天体物理研究中大质量O型星扮演着至关重要的角色。它们不仅是宇宙中光度最高的天体之一其强烈的辐射、恒星风和最终的超新星爆发更是驱动星系化学演化和能量注入星际介质的关键引擎。然而深入理解这些“宇宙巨人”的物理状态传统上依赖于一项极其昂贵且耗时的技术高分辨率光谱观测。通过分析恒星光谱中的吸收线天文学家可以精确测定其有效温度、表面重力等核心参数进而将其定位在赫罗图上揭示其演化阶段。但问题在于像IACOB这样的专项光谱巡天项目耗时十余年动用多台大型望远镜也仅能获取约一千颗大质量恒星的高质量光谱数据。与此同时以TESS凌星系外行星巡天卫星和即将全面运行的LSST薇拉·鲁宾天文台时空遗产巡天为代表的测光巡天项目正在以前所未有的规模产生海量的时间序列数据——即光变曲线。TESS已经为超过20万颗恒星提供了从20秒到30分钟不等采样率的光变数据。这些数据如同恒星的心电图记录了其亮度随时间的变化蕴含着丰富的物理信息如脉动、旋转、星震活动等。但光变曲线本身并不直接给出温度、光度等参数。这就形成了一个巨大的鸿沟我们拥有海量的、相对容易获取的测光数据却缺乏与之匹配的、精确的物理参数标签。机器学习特别是深度学习为弥合这一鸿沟提供了全新的范式。其核心思想是如果我们能建立一个模型学习从光变曲线的特征到已知光谱参数的复杂映射关系那么理论上我们就可以用这个训练好的模型去预测那些仅有光变曲线数据的、海量恒星的基本参数。这并非简单的数据拟合而是让模型从数据中自动挖掘那些对人类而言可能隐晦难辨的物理关联。本次分享的项目正是对这一范式的深入实践。我们聚焦于O型星利用TESS的光变曲线和IACOB项目提供的光谱参数作为“教材”系统对比了两种主流的神经网络架构——多层感知机MLP和卷积神经网络CNN——在预测恒星有效温度Teff和光谱光度log L等关键参数上的表现。我们的目标很明确第一验证光变曲线中是否真的编码了足以推断恒星基本物理状态的信息第二探索如何最有效地从光变曲线中“榨取”这些信息。2. 数据准备与特征工程从原始流量到模型输入任何机器学习项目的基石都是高质量、处理得当的数据。我们的工作流始于两个核心数据源NASA的TESS卫星和地面光谱巡天项目IACOB。2.1 数据来源与交叉匹配TESS数据方面我们下载了2分钟采样率的PDCSAP预处理数据条件简单孔径测光光变曲线。PDCSAP流量值已经过仪器系统误差的校正比原始的SAP流量更干净更适合进行科学分析。为了从TESS观测的数十万颗恒星中筛选出我们感兴趣的大质量OBA型星候选体我们参考了IJspeert等人2021的星表该星表基于TESS输入星表的J-H和J-K颜色判据筛选出了近19万颗OBA型星候选体其中超过9万颗有可用的光变曲线。光谱参数则来自IACOB数据库这是一个专注于大质量O型和B型星的高分辨率光谱库。我们采用了其中257颗O型星的参数这些参数是通过一套半自动化的、均一的分析流程结合iacob-broad和iacob-gbat工具以及FASTWIND模型网格得到的确保了数据内部的一致性。关键参数包括有效温度Teff、表面重力对数log g并通过公式L Teff^4 / g计算出光谱光度对数log L。这个光谱光度与经典赫罗图中的绝对光度不同它不依赖于距离测量且对表面重力变化敏感因此能更清晰地反映大质量恒星在光谱赫罗图上的演化轨迹。接下来的关键步骤是交叉匹配。我们将IACOB星表中的恒星与TESS观测目标进行匹配最终得到了一个包含285条光变曲线的数据集对应106颗独特的O型星因为TESS会对同一颗星在不同天区进行多次观测每个观测时段视为一个独立样本。这个样本涵盖了从早型O6及更早到晚型O9及更晚的O型星以及矮星、巨星、超巨星等不同光度等级虽然样本量不大但具有较好的代表性。注意数据清洗与一致性。在匹配和合并数据集时我们剔除了任何包含NaN非数值流量值的光变曲线。确保输入数据的完整性和清洁度是避免模型训练出现异常的第一步。此外虽然IACOB也包含B型星数据但本次研究我们刻意只使用O型星。这是因为O星和B星的分析流程、采用的模型网格和校准细节存在细微差异混合训练可能会引入系统性的不均匀性并且B星的数量优势可能会使模型偏向于学习B星的特征将O星视为“离群值”。在方法论探索阶段保持样本的物理一致性和分析的同质性至关重要。2.2 从时序到频域周期图生成原始的光变曲线是时间序列数据直接将其输入神经网络尤其是MLP会面临序列长度不一、时间采样不均匀、以及噪声模式复杂等问题。一个更有效的做法是将其转换到频域。我们采用了天文学中处理非均匀采样时间序列的标准工具Lomb-Scargle周期图。具体操作步骤如下归一化对每条光变曲线将其流量值除以其中值。这一步旨在消除不同恒星之间绝对亮度差异的影响让模型专注于相对变化模式。计算周期图使用Lomb-Scargle算法将归一化后的时间序列转换为功率谱密度PSD图。我们设定的频率范围为0.04到250 Hz步长为0.04 Hz为每条光变曲线生成一个包含6249个频率点的周期图。这个范围覆盖了从几个小时到几分钟的典型脉动周期。幅度归一化对周期图的功率谱密度值进行归一化使其值域落在0到1之间。这有助于稳定训练过程避免某些频率点因功率过高而主导模型学习。经过上述处理每条光变曲线被转化为一个长度为6249的一维向量它表征了该恒星亮度变化在不同频率上的功率分布。这个周期图将成为我们CNN模型的直接输入。2.3 红噪声参数提取一种物理启发的特征工程除了使用完整的周期图我们还探索了另一种基于天体物理先验知识的特征提取方法。此前的研究如Blomme等人2011Bowman等人2019指出大质量恒星光变曲线中的低频“红噪声”成分即功率随频率降低而增加的非周期性变化可能与恒星参数相关。这种红噪声被认为源于恒星内部的物理过程如对流核激发出的内部重力波、次表面对流或星风不稳定性。因此我们对每个周期图用以下函数进行拟合α(ν) α0 / [1 (ν/ν_char)^γ] C_W这个函数包含四个参数α0零频率处的振幅表征红噪声的整体强度。ν_char特征频率标志红噪声功率开始下降的频率位置。γ对数振幅梯度描述功率随频率下降的快慢。C_W与频率无关的白噪声项主要来自仪器和光子噪声。通过拟合我们为每条光变曲线得到了这4个标量参数。将它们归一化到[0, 1]区间后就构成了一个极其低维仅4维的特征向量。这个向量将作为我们MLP模型的输入。这种方法的核心思想是用这4个具有物理意义的参数来“概括”整条光变曲线的红噪声特性从而大幅降低输入维度。实操心得特征工程的两条路径。这里体现了两种截然不同的特征工程思路。路径一MLP红噪声参数依赖领域知识进行强特征工程将高维、复杂的原始数据提炼为少数几个物理意义明确的特征。优点是模型简单、训练快速、可解释性相对较强但风险在于可能丢失了周期图中除红噪声外其他有价值的信息如特定频率的脉动峰。路径二CNN完整周期图将原始转换后的数据直接喂给模型让模型自己学习如何提取特征。CNN的卷积层擅长捕捉局部模式和层次化特征理论上能发现人类未曾预设的关联。但缺点是模型更复杂、需要更多数据、可解释性差。我们的对比实验本质上就是在检验天文学家基于现有物理理解手工构建的特征红噪声参数是否已经足够好还是说把“原材料”交给更强大的模型它能发现我们忽略的“宝藏”3. 模型架构设计与训练策略我们的实验设计围绕一个核心对比展开使用手工提取的4个红噪声参数作为输入的MLP模型与使用完整6249维周期图作为输入的CNN模型在预测恒星参数任务上的性能差异。3.1 多层感知机MLP模型MLP是一种经典的、全连接的前馈神经网络。由于其结构简单非常适合处理像我们红噪声参数这样的低维、扁平化输入。模型设计 我们为两个略有不同的预测任务设计了最佳的MLP架构通过网格搜索确定MLP1输入层4个节点 - 隐藏层1256节点ReLU激活 - 隐藏层2512节点ReLU激活 - 隐藏层3128节点ReLU激活 - 输出层2个节点Teff 和 log g。总参数量约为19.9万。预测出Teff和log g后再根据公式计算log L。MLP2输入层4个节点 - 隐藏层1512节点ReLU激活 - 隐藏层2256节点ReLU激活 - 隐藏层3128节点ReLU激活 - 输出层2个节点Teff 和 log L。总参数量约为16.7万。设计考量深度与宽度三层隐藏层提供了足够的非线性拟合能力。中间层节点数较多旨在学习红噪声参数与恒星参数之间可能存在的复杂非线性映射。输出目标我们尝试了两种输出策略。MLP1预测Teff和log g是更“基础”的观测参数MLP2直接预测Teff和log L后者是光谱赫罗图的纵坐标。对比两者性能有助于理解模型学习不同参数组合的难易程度。激活函数全线使用ReLU修正线性单元因其能有效缓解梯度消失问题加速训练收敛。3.2 卷积神经网络CNN模型CNN专为处理具有网格状拓扑结构的数据如图像、音频、时间序列而设计。我们的一维周期图正是一种具有局部相关性的序列数据CNN的卷积核可以滑动扫描自动检测不同频率范围内的局部模式例如某个特定频段的功率凸起可能对应某种类型的脉动模式。模型设计 我们为两个预测任务使用了相同的CNN架构因为输入都是完整的周期图CNN1/CNN2架构输入层接收形状为 (1, 6249) 的周期图单通道长度6249。卷积块164个卷积核核大小5填充2保持长度后接ReLU激活和最大池化池化核大小2步长2。输出形状变为 (64, 3124)。卷积块264个卷积核核大小5填充2后接ReLU激活和最大池化核大小2步长2。输出形状变为 (64, 1562)。卷积块364个卷积核核大小5填充2后接ReLU激活和最大池化核大小2步长2。输出形状变为 (64, 781)。展平层将三维张量展平为一维向量长度为 64 * 781 49984。全连接层一个包含128个节点的全连接层后接ReLU激活。输出层2个节点的线性输出层。对于CNN1输出Teff和log g对于CNN2输出Teff和log L。 总参数量约为644万远高于MLP。设计考量卷积核大小大小为5的卷积核可以在频率轴上覆盖一个中等范围的局部区域既能捕捉局部特征又不会过于局限。通道数从64个通道开始并保持让网络有能力学习多种不同的特征检测器。池化层最大池化层逐步降低序列的长度即降低分辨率在扩大后续层感受野的同时提供了一定的平移不变性并减少了计算量。参数量对比CNN参数量远大于MLP这主要源于卷积层的大量权重。为了公平比较我们也尝试了用完整周期图作为输入、参数量与CNN相当的MLP“大MLP”但其性能依然不如CNN这证明了CNN架构在处理这种结构化序列数据时的内在优势而非仅仅是参数量的优势。3.3 训练流程与超参数设置为了确保对比的公平性我们为所有模型设定了统一的训练框架数据划分将285个样本随机划分为训练集80%228个和测试集20%57个。由于样本量小我们采用了29次不同随机种子的运行并报告性能的中位数和分布以评估模型的稳健性。损失函数与优化器使用均方误差MSE作为损失函数直接衡量预测参数与真实参数之间的数值差异。优化器选用Adam初始学习率设为1e-3。学习率调度与早停采用ReduceLROnPlateau策略当验证集损失在连续15个CNN或20个MLPepoch内没有改善时将学习率减半。同时设置早停patience50防止过拟合。输入标准化无论是4个红噪声参数还是完整的周期图在输入网络前都进行了归一化缩放到[0,1]区间。对于周期图我们还额外进行了取对数log10变换以压缩其动态范围使功率谱的分布更接近正态。注意事项小样本学习的挑战。仅有285个样本对于深度学习来说是非常小的数据集极易导致过拟合。我们的策略是第一使用相对简单的网络结构特别是MLP第二严格使用早停和验证集监控第三依赖多次随机运行来评估性能的统计显著性。尽管如此这仍然是本项目的一个主要局限。未来扩大数据集是提升模型泛化能力和可靠性的根本途径。4. 结果分析与性能对比经过系统的训练和评估两种模型路径的表现呈现出清晰且富有启示性的差异。4.1 MLP模型基于红噪声参数的表现使用4个红噪声参数作为输入的MLP模型其预测能力相当有限。MLP1预测Teff和log g在预测光谱光度log L时通过Teff和log g计算得出中位R²分数仅为0.254。这意味着模型仅能解释目标变量约25.4%的方差。预测Teff的效果更差R²为0.123。预测log g稍好R²为0.346。从预测值与真实值的散点图上看数据点广泛分散在对角线两侧且存在明显的向平均值聚拢的趋势。MLP2直接预测Teff和log L性能略有改善log L的R²升至0.257Teff的R²升至0.152但整体仍不理想。关键发现尽管此前的研究表明红噪声参数与恒星参数存在相关性但我们的实验证明仅凭这四个参数进行预测其信息量是严重不足的。模型无法准确还原恒星参数在真实物理空间中的分布。在图3的光谱赫罗图上MLP2的预测结果紫色方块紧地聚集在几个离散的团块中完全无法复现观测数据灰色圆点所展现出的在温度-光度平面上的连续、宽广的分布。这强烈暗示红噪声参数虽然相关但不足以唯一地确定一颗恒星在赫罗图上的精确位置。4.2 CNN模型基于完整周期图的表现使用完整周期图作为输入的CNN模型性能实现了质的飞跃。CNN1预测Teff和log g在预测log L上表现最佳中位R²达到0.641。预测Teff的R²为0.443。尤为出色的是对表面重力log g的预测R²高达0.771。这表明光变曲线中编码了非常丰富的、与恒星表面重力相关的信息。CNN2直接预测Teff和log L同样表现出色预测log L的R²为0.664略优于CNN1预测Teff的R²为0.346。性能飞跃的解读CNN模型的成功并非偶然。首先完整的周期图包含了从低频红噪声到可能的高频脉动信号的全部信息CNN有能力从中学习到比四个拟合参数更精细、更复杂的模式。其次CNN的架构特性——局部连接、权重共享、层次化特征提取——特别适合挖掘频域序列中的局部相关性和多尺度特征。例如卷积层可能学会了识别某些特定频率范围的功率包络形状这些形状可能与恒星的演化状态、质量或旋转速度相关联。4.3 综合对比与天体物理解释最直观的对比体现在光谱赫罗图图3上。CNN1的预测结果橙色星号虽然仍有误差但其数据点大致沿着理论演化轨迹灰色曲线分布并且覆盖了与观测数据相似的区域成功捕捉到了大质量O型星从主序到后主序演化的散布趋势。而MLP2的预测则完全丢失了这种物理上的分布信息。我们计算了一个多元R²来衡量模型在Teff, log L二维参数空间上整体解释方差的能力。CNN1的多元R²为0.424意味着它解释了两个参数联合方差的42.4%。而MLP2的多元R²为-0.060其预测效果甚至不如直接预测所有样本的均值。这个负值表明基于红噪声参数的简单模型其预测误差比一个最简单的常数模型总是预测平均值还要大。天体物理意义CNN模型能够从光变曲线中相对成功地预测log L和log g这具有深刻的天体物理含义。光谱光度log L log(Teff^4 / g)同时依赖于温度和重力。CNN模型能较好地预测它说明光变曲线的变化模式与恒星内部的物理状态通过温度和重力反映存在可被机器学习捕捉的关联。这支持了之前的猜想光变曲线中的变异性无论是红噪声还是周期性脉动源于内部物理过程如对流、波、星震而这些过程又与恒星的基本参数和演化状态紧密相连。我们的工作将这种关联从“相关性”推进到了“预测性”的阶段。实操心得模型稳定性的交叉验证。由于数据集小我们格外关注模型预测的稳定性。我们检查了那些被TESS多个观测扇区Sector观测过的同一颗恒星。结果发现对于同一颗星CNN模型在不同扇区数据上预测出的参数值其标准差远小于模型在不同恒星间的预测散布范围。例如CNN1预测的Teff同一颗星在不同扇区间的平均标准差仅为570 K而模型在所有测试星上的预测误差范围可达数千K。这有力地证明模型的预测信号是稳健的主要反映的是恒星本身的特性而非观测扇区带来的随机噪声或系统偏差。5. 局限、挑战与未来展望尽管CNN模型取得了鼓舞人心的成果但我们必须清醒地认识到当前工作的局限性和面临的挑战。5.1 当前方法的局限性样本量与类别不平衡285条光变曲线对应106颗星对于深度学习而言是极小的样本。这直接导致模型表现出明显的“趋向均值”效应regression toward the mean即对参数极端值非常高或非常低的温度、光度的预测能力很差。这在图2的所有子图中都能看到预测值范围明显小于真实值范围。我们的样本中中期O型星和矮星占多数早/晚期O型星、巨星/超巨星的样本较少这种不平衡进一步加剧了模型对多数类的偏向。输入表征的潜在信息损失我们使用的是周期图它是原始光变曲线经傅里叶变换后的功率谱。这个转换过程丢失了相位信息并且可能平滑掉一些时域上的瞬变特征。直接使用原始时域光变曲线或者使用时频分析如小波变换得到的更丰富的表征或许是未来的一个方向但这会引入更复杂的序列建模问题如需要循环神经网络RNN或Transformer。物理可解释性黑箱CNN是一个黑箱模型。虽然它预测性能好但我们很难说清它到底“看”到了周期图中的什么特征做出了判断。这与基于红噪声参数的MLP模型形成对比后者的输入特征本身具有明确的物理假设。提升模型的可解释性例如通过注意力机制Attention或特征可视化将是连接数据驱动发现与天体物理解释的关键桥梁。5.2 模型优化与改进策略针对上述局限在现有框架内可以尝试多种改进应对小样本和不平衡数据增强对光变曲线添加可控的噪声、进行小幅度的伸缩或平移人工扩大训练集。损失函数重加权为少数类如早型O星、超巨星的样本在损失函数中赋予更高的权重迫使模型更关注它们。分层采样确保训练集和测试集中各类别早、中、晚型矮星、巨星、超巨星的比例与总体本一致。迁移学习未来可以考虑先在数据量更大的B型星或其它变星的光变曲线数据上进行预训练再微调Fine-tune到O型星上。模型架构探索混合模型可以将红噪声参数作为物理先验特征与周期图一起输入网络例如在CNN提取的高级特征后拼接上这4个参数看看是否能结合两者的优势。更先进的网络尝试一维ResNet、Inception模块或注意力机制看是否能更高效地提取频域特征。不确定性量化采用贝叶斯神经网络或蒙特卡洛Dropout为模型的每个预测提供一个不确定性区间这对于后续的光谱跟踪观测优先级排序至关重要。5.3 未来应用场景与拓展方向这项技术的长远价值在于应对即将到来的数据海啸。LSST时代的应用薇拉·鲁宾天文台的LSST项目将在十年内对数以千万计的恒星进行监测产生前所未有的光变曲线数据集。我们的方法可以为其中海量的大质量恒星包括O、B型星提供初步的物理参数估计Teff, log L, log g绘制出大规模的光谱赫罗图。这能帮助天文学家在浩瀚星海中快速定位处于特定演化阶段如即将爆发的超新星前身星、恒星风质量损失剧烈的阶段的稀有天体。光谱观测的“侦察兵”高分辨率光谱观测望远镜时间极其宝贵。我们的模型可以充当高效的筛选工具先利用LSST或TESS扩展任务的光变曲线对数百万颗恒星进行参数初筛从中选出最具科学价值例如参数异常、处于关键演化阶段的目标再申请昂贵的光谱观测进行确认和精细研究。这将极大提升光谱观测的效率。向更广恒星类型拓展下一步自然是将此框架扩展到早期B型星甚至A、F型星。不同光谱型的恒星其光变曲线的主导物理机制不同如SPB星和β Cep星的脉动需要调整模型或引入光谱型作为先验信息。最终目标是建立一个统一的、能够处理从O型星到M型矮星的广谱变曲线参数预测管道。多波段数据融合目前仅使用了TESS的单波段宽白光变曲线。未来的巡天如LSST将提供多波段ugrizy光变曲线。结合颜色信息不同波段的亮度比无疑能为模型提供更强的约束有望进一步提升参数预测的精度甚至预测金属丰度等其他参数。从更宏观的视角看这项工作代表了天体物理学研究范式的一种转变从“假设驱动”的模型拟合到“数据驱动”的模式发现。我们不再仅仅用物理模型去拟合数据而是让算法从数据中直接学习物理规律的表征。虽然CNN的黑箱特性意味着我们暂时丢失了一些物理洞察的直观性但它却可能打开一扇门让我们发现那些尚未被现有理论框架所描述的、光变曲线与恒星内部物理之间新的、更微妙的联系。这或许才是机器学习带给天文学最深远的礼物不仅是效率工具更是新的发现引擎。