当前位置：首页 > news >正文

嵌入几何不变性与集成学习的湍流亚格子应力机器学习建模

news 2026/5/25 10:16:28

1. 项目概述当湍流遇上机器学习在计算流体力学和大气科学的圈子里搞模拟的同行们最头疼的问题之一就是如何准确刻画那些我们计算网格“看”不到的湍流细节也就是亚格子尺度应力。这活儿干不好整个大涡模拟的精度就悬了。传统上我们依赖像Smagorinsky模型这样的经验公式给那个关键的涡粘系数Cs设个常数。但湍流这玩意儿天生就是非均匀、非定常的一个固定的Cs想包打天下实测下来偏差往往不小。后来有了动态Smagorinsky模型想法很妙让Cs能随流场实时变化但代价是容易引入数值振荡算着算着就崩了稳定性是个大问题。这几年机器学习尤其是神经网络给这个老问题带来了新思路。其核心价值在于它能从海量的高保真数据比如直接数值模拟或高分辨率大涡模拟的结果中自动学习出亚格子应力与可解尺度流场之间极其复杂的非线性映射关系。这相当于让模型自己“悟”出物理规律而不是我们人为强加一个可能并不完美的公式。但纯数据驱动的模型也有“黑箱”的毛病物理可解释性差而且可能不遵守基本的物理定律比如伽利略不变性。我最近花了不少时间琢磨怎么把物理和几何的“魂”给注入到机器学习模型里。具体来说就是利用张量不变量和局部流场的奇异值分解来构造输入特征。这么做的目的是让模型从根儿上就具备旋转、平移、反射等几何不变性确保预测结果不依赖于我们观察流场的坐标系。同时结合集成学习策略用多个神经网络的“集体智慧”来提升预测的稳定性和精度。这套方法在中尺度大气模拟特别是飓风边界层这种极端复杂的流动场景下展现出了不错的潜力。如果你也在为湍流模型的精度和稳定性发愁或者对如何将物理先验知识融入数据驱动模型感兴趣那接下来的内容或许能给你一些直接的参考。2. 核心思路嵌入不变性的数据驱动建模框架2.1 问题本质与建模目标拆解我们面对的核心问题是在大涡模拟中如何用一个模型来准确表征被过滤掉的亚格子尺度应力 $\tau_{ij}$ 对可解尺度运动的影响。最经典的Smagorinsky模型将其表述为 $\tau_{ij} - \frac{1}{3}\tau_{kk}\delta_{ij} -2 (C_s \Delta)^2 |\widetilde{S}| \widetilde{S}{ij}$ 这里$\widetilde{S}{ij}$ 是滤波后的应变率张量$|\widetilde{S}|$ 是其模长$\Delta$ 是滤波宽度。模型的好坏几乎完全系于那个Smagorinsky系数 $C_s$ 上。传统模型取常数动态模型DSM通过Germano恒等式动态计算但数值稳定性堪忧。因此我们建模的终极目标是构建一个数据驱动的代理模型其输入是可解尺度的流场信息输出是符号Smagorinsky系数 $C_s$注意是带符号的这对表征能量反串级至关重要。这个模型需要满足几个硬性要求高精度预测的 $C_s$ 需要与基于湍动能生成项定义的“真实值”高度吻合。强稳定性预测结果不能像动态模型那样剧烈振荡导致模拟发散。物理一致性预测必须满足基本的物理约束比如伽利略不变性模型预测不应随观察者的匀速运动而改变和材料标架无差异性。泛化能力在训练数据未覆盖的流态下依然能有合理的表现。注意直接让神经网络学习 $\tau_{ij}$ 本身与流场的关系是更直接的但本研究选择预测 $C_s$相当于学习了一个“模型系数校正器”。这样做的好处是最终模型结构仍与传统Smagorinsky模型保持一致更容易被现有的CFD求解器集成也便于和传统方法进行对比分析。2.2 几何不变性嵌入从“黑箱”到“灰箱”要让机器学习模型具备物理一致性关键一步是构造具有不变性的输入特征。我们放弃了直接使用原始速度梯度 $\partial u_i / \partial x_j$ 作为输入因为它显然不满足旋转不变性——坐标系一转数值全变模型就得重新学。我们的策略是转向张量不变量。对于一个二阶张量比如应变率张量 $\mathbf{S}$ 和旋转率张量 $\mathbf{\Omega}$它们存在一组基本的不变量这些标量值在坐标旋转下保持不变。例如对于 $\mathbf{S}$ 和 $\mathbf{\Omega}$常用的不变量包括$I_1 \text{tr}(\mathbf{S}) S_{kk}$ 对于不可压流动此项为零$I_2 \frac{1}{2}[(\text{tr}(\mathbf{S}))^2 - \text{tr}(\mathbf{S}^2)]$$I_3 \det(\mathbf{S})$$Q \frac{1}{2}(||\mathbf{\Omega}||^2 - ||\mathbf{S}||^2)$ 第二不变量$R -\det(\mathbf{S}) - \frac{1}{3}\text{tr}(\mathbf{S}^3)$ 第三不变量这些不变量构成了描述局部流动状态的“指纹”。然而仅使用中心点的张量不变量丢失了至关重要的空间关联信息。湍流结构不是孤立的点而是具有空间相干性的。因此我们引入了群学习策略。不是只给模型看一个点而是给它看一个“邻居群”。具体操作是对于网格中的每一个中心点我们选取其周围一定邻域例如3x3或5x5的二维网格点内的所有点。对每个邻居点同样计算其速度梯度张量进而得到一组张量不变量。这样每个中心点的输入特征就变成了一个由邻居点不变量组成的“特征云”。但这还没完。这个“特征云”的排列顺序如果依赖于某个特定的坐标系比如按x, y坐标排序那模型可能学到的是虚假的空间顺序模式而非真正的物理关联。为了解决这个问题我们祭出了奇异值分解这把利器。2.3 奇异值分解实现排列不变性的关键假设我们有一个包含 $N$ 个邻居点的特征云每个点有 $d$ 个不变量特征那么可以形成一个 $N \times d$ 的特征矩阵 $\mathbf{X}$。直接把这个矩阵输入神经网络其行顺序即邻居点的顺序会影响学习。SVD的精妙之处在于它对矩阵 $\mathbf{X}$ 进行分解$\mathbf{X} \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T$。其中$\mathbf{\Sigma}$ 是一个对角矩阵其对角线上的元素就是奇异值它们按照从大到小的顺序排列。关键点在于奇异值本身是排列不变的无论你如何打乱 $\mathbf{X}$ 的行即改变邻居点的排列顺序得到的奇异值序列 $\sigma_1, \sigma_2, ..., \sigma_r$ $r$ 是矩阵的秩是保持不变的。奇异值表征了特征云的主成分能量最大的奇异值对应特征云中方差最大的方向反映了邻居点群体最显著的共同变化模式。因此我们取前 $k$ 个最大的奇异值以及可选的其他SVD输出如 $\mathbf{U}$ 或 $\mathbf{V}$ 矩阵的部分元素构成一个固定长度的特征向量作为神经网络的最终输入。这个向量完美地实现了我们想要的两个不变性几何不变性因为输入是张量不变量本身与坐标旋转无关。排列不变性因为SVD提取的奇异值对输入行的顺序不敏感。这就好比我们不告诉模型每个邻居具体是谁、坐在哪个位置而是告诉它“在这个小团体里影响力最大的那个特征强度是 $\sigma_1$第二大的强度是 $\sigma_2$ ...”。模型基于这种“群体统计特征”来做预测自然就具备了不变性。实操心得在实现时需要确定保留多少个奇异值。一个经验法则是保留到累计能量占比$\sum_{i1}^k \sigma_i^2 / \sum_{i1}^r \sigma_i^2$达到95%以上。对于3x3网格9个点通常前3-4个奇异值就够了对于5x5网格25个点可能需要5-7个。这本身也是一个可以优化的超参数。3. 模型架构设计与训练策略3.1 神经网络配置与超参数选择本研究采用了全连接前馈神经网络作为核心模型。网络结构相对经典但超参数的选择经过了仔细的网格搜索。以下是我们在实验中验证过的几种典型配置模型代号隐藏层数每层神经元数激活函数备注NN-1250ReLU基准中等复杂度模型NN-22100ReLU增加宽度NN-32200ReLU最佳分类模型NN-4250Tanh对比激活函数NN-52100Tanh对比激活函数NN-62200Tanh对比激活函数为什么选择这样的配置隐藏层数与神经元数我们主要探索了2层隐藏层因为对于学习 $C_s$ 这种相对复杂的非线性映射2-3层通常能在表达能力和训练难度间取得较好平衡。神经元数从50到200旨在观察模型容量对性能的影响。结果表明在分类任务中200个神经元的网络NN-3因其强大的特征捕获能力取得了最高的F1分数。激活函数ReLU和Tanh是两种最常用的激活函数。ReLU计算简单能缓解梯度消失问题促进稀疏激活通常能使模型更快收敛。Tanh输出以零为中心梯度在原点附近更大理论上可能有利于梯度流动但其饱和区绝对值较大时梯度接近零可能导致训练变慢。我们的损失曲线也印证了这一点ReLU模型收敛更快。输出层对于分类任务预测 $|C_s|$ 的大小类别输出层使用Sigmoid激活函数二分类或Softmax多分类输出类别概率。对于回归任务预测带符号的 $C_s$ 值输出层使用线性激活函数。3.2 数据准备与特征工程流程模型的性能很大程度上取决于喂给它的数据。我们的数据来源于高保真的飓风边界层大涡模拟结果。以下是关键的数据处理步骤数据提取与标签生成从大涡模拟快照中提取每个网格点的速度场 $u_i$。计算每个点的速度梯度张量 $\partial u_i / \partial x_j$。基于湍动能生成项公式计算每个点的“真实” $C_s$ 值作为回归任务的标签。对于分类任务根据 $|C_s|$ 的分布例如按中位数或特定分位数将每个点的 $C_s$ 标记为“大”或“小”两类。构造邻居群与特征计算对于网格中的每一个目标点定义其邻域范围。我们对比了3x3网格9个点和5x5网格25个点两种尺度。对邻域内的每一个点包括中心点计算应变率张量 $\mathbf{S}$ 和旋转率张量 $\mathbf{\Omega}$进而计算一组选定的张量不变量如 $||\mathbf{S}||, ||\mathbf{\Omega}||, Q, R$ 等。这样就为每个邻居点得到一个不变量特征向量。应用SVD获取排列不变特征将目标点所有邻居的不变量特征向量堆叠成矩阵 $\mathbf{X}$尺寸邻居数 × 不变量个数。对 $\mathbf{X}$ 进行奇异值分解。提取前 $k$ 个最大的奇异值构成目标点的最终输入特征向量。数据集划分与平衡采样将整个计算域的所有点随机打乱按比例如70%/15%/15%划分为训练集、验证集和测试集。特别注意分类任务中的类别不平衡问题。如果“大 $|C_s|$”和“小 $|C_s|$”的样本数量悬殊模型会倾向于预测多数类导致对少数类的召回率极低。我们采用了平衡采样在训练时每个批次batch中从两个类别中抽取等量的样本确保模型平等地学习两个类别。3.3 训练细节与损失函数优化器我们使用Adam优化器它结合了动量法和自适应学习率在大多数情况下比标准的随机梯度下降表现更好。初始学习率通常设为1e-3或1e-4并配合学习率衰减策略。损失函数分类任务使用二元交叉熵损失。这是二分类任务的标准选择它衡量了模型预测的概率分布与真实标签分布之间的差异。BCE Loss -1/N * Σ [y_i * log(ŷ_i) (1 - y_i) * log(1 - ŷ_i)]回归任务使用均方误差损失。MSE对大的误差惩罚更重能驱使模型更关注那些难以预测的样本点。MSE 1/N * Σ (y_i - ŷ_i)^2正则化为了防止过拟合除了使用验证集进行早停外我们还引入了L2权重衰减和Dropout。L2衰减通过在损失函数中添加权重的平方和项惩罚过大的权重促使模型更简单。Dropout则在训练时随机“关闭”一部分神经元强迫网络不依赖于任何单个神经元从而学习到更鲁棒的特征。训练轮数与早停我们设置了较大的训练轮数上限如500轮但配合早停策略。当验证集损失在连续多个轮次如20轮内不再下降时就停止训练并回滚到验证损失最低的模型参数。4. 分类模型性能深度剖析我们首先将问题构建为一个分类任务判断局部流场对应的 $|C_s|$ 属于“大”还是“小”类别。这有助于我们理解模型区分不同湍流状态如高剪切区与低能区的能力。4.1 无几何不变性的逐点学习基准作为对比基准我们训练了不使用邻居信息即仅使用中心点的张量不变量且不经过SVD处理的神经网络。表IV对应原文Table IV的结果显示了一个有趣的平台现象模型配置准确率精确率召回率F1分数NN-1 (50, ReLU)0.600.610.510.56NN-2 (100, ReLU)0.610.620.550.58NN-3 (200, ReLU)0.620.620.670.64NN-4 (50, Tanh)0.600.610.520.56NN-5 (100, Tanh)0.610.610.580.60NN-6 (200, Tanh)0.610.610.630.62关键发现性能瓶颈所有模型的准确率和精确率都徘徊在0.60-0.62之间提升有限。这说明仅凭单点的局部信息模型难以做出非常准确的分类天花板较低。召回率差异召回率的变化范围更大0.51-0.67。召回率衡量的是模型找出所有“大 $|C_s|$”样本的能力。可以看到神经元更多的模型NN-3, NN-6召回率显著更高。这是因为更大的网络容量能捕捉到更细微、更复杂的特征模式从而减少了漏报。最佳配置NN-3200神经元ReLU在多数指标上领先尤其是在召回率和F1分数上。F1分数是精确率和召回率的调和平均是衡量二分类模型综合性能的更好指标。NN-3的F1分数最高说明它在不漏掉正样本的同时也能保持较高的预测纯度。实操心得当你的分类模型准确率卡在一个水平上不去时别只盯着准确率。看看召回率和精确率特别是F1分数。如果召回率低说明模型“保守”很多正样本没找出来。这时增加模型复杂度如更多神经元、更深层往往是有效的因为模型需要更强的能力去挖掘那些难以区分的特征。4.2 引入几何不变性的群学习效果飞跃当我们切换到群学习模式并引入SVD处理来嵌入几何与排列不变性后模型性能实现了质的飞跃。以下是基于3x3邻居网格的结果对应原文Table V模型配置准确率精确率召回率F1分数NN-10.700.690.730.71NN-20.700.690.740.71NN-30.710.690.750.72NN-40.700.690.730.71NN-50.700.690.740.71NN-60.700.690.740.71性能提升解读全面提升所有指标相比逐点学习基准提升了约10个百分点。准确率从~0.61跃升至~0.70F1分数从~0.62跃升至~0.72。这 unequivocally 证明了空间上下文信息对于区分湍流状态至关重要。收敛行为观察训练损失曲线对应原文Figure 10发现NN-1ReLU和NN-4Tanh都表现出稳定下降且训练损失与测试损失紧密贴合说明没有明显过拟合。NN-4Tanh的收敛速度稍慢这与Tanh函数在原点附近梯度最大、但在饱和区梯度消失的特性有关。模型容量影响与基准实验一致更宽的模型NN-3仍然取得了最好的召回率和F1分数。这说明即使在引入了更丰富的空间特征后模型容量仍然是充分学习复杂模式的关键。4.3 扩大邻居尺度从3x3到5x5一个很自然的问题是邻居圈划多大合适我们将邻域从3x39点扩大到5x525点结果如下对应原文Table VI模型配置准确率精确率召回率F1分数NN-10.720.700.750.72NN-20.720.700.760.73NN-30.720.700.760.73NN-40.720.700.750.73NN-50.720.700.760.73NN-60.720.700.760.73核心结论性能进一步提升所有模型的性能在5x5网格上又有了小幅但一致的提升。准确率稳定在0.72召回率最高达到0.76。这说明更大的邻域提供了更全面的局部湍流结构信息有助于模型做出更准确的判断。模型间差异缩小在5x5网格上不同模型配置之间的性能差异变得非常小。这表明当输入特征足够丰富、信息量足够大时模型架构的细微差别如50 vs 200神经元ReLU vs Tanh对最终性能的影响被削弱了。特征工程的质量在此刻比模型调参更重要。收敛更快损失曲线对应原文Figure 11显示在5x5网格上训练时模型在初始阶段损失下降更快说明扩大的空间上下文帮助模型更快地捕捉到关键特征。避坑指南选择邻居尺度是一个权衡。更大的邻域能提供更多上下文但也会增加计算成本SVD处理的矩阵更大特征向量更长。可能引入噪声对于非常局部的突变大邻域的平均效应可能会稀释关键信号。在边界处处理更复杂需要合理的边界填充策略如对称边界、周期边界。实践中建议从与湍流积分尺度相关的物理考虑出发先尝试一个合理的尺度如3-5倍网格尺度再通过实验调整。我们的结果表明从3x3到5x5有收益但收益在递减暗示可能存在一个最优尺度。5. 回归模型预测与集成学习优化分类模型告诉我们流场属于哪种状态但最终我们需要一个精确的数值——带符号的 $C_s$。这就是回归任务。5.1 单神经网络回归的局限我们训练了不同深度和宽度的全连接网络来直接预测 $C_s$。图12对应原文Figure 12展示了两个代表性网络的预测与真实值的对比一个相对简单的网络n8, l2和一个更复杂的网络n32, l2。观察到的现象整体趋势捕获两个网络都能抓住 $C_s$ 随空间变化的主要趋势预测曲线与真实曲线的大致走向是吻合的。局部偏差在 $C_s$ 变化剧烈的高变异性区域两个网络都出现了明显的预测偏差。简单网络的偏差看起来更“散乱”而复杂网络的偏差有时表现为局部的“过冲”或“欠冲”。细节审视图13对应原文Figure 13的放大区域清晰揭示了这一点。简单网络在某些峰值和谷值处平滑过度未能捕捉到尖锐的变化复杂网络虽然能更好地拟合一些细节但在另一些区域却产生了更大的误差振荡。量化评估表VII对应原文Table VII列出了所有单网络配置在测试集上的均方误差。一个有趣的发现是并非网络越复杂MSE就越低。例如8神经元、4层的网络取得了最低的MSE之一1.82e-6而某些32神经元的网络MSE反而更高2.87e-4。这说明在回归任务中过拟合的风险显著增加。复杂网络更容易记住训练数据中的噪声导致在未见过的测试数据上泛化能力变差。核心教训对于湍流这种包含多尺度、间歇性极强的物理场的回归问题盲目增加神经网络复杂度是危险的。模型需要在“拟合能力”和“泛化能力”之间取得精妙的平衡。此外负 $C_s$代表能量反串级的预测是难点和关键。从误差分析看模型在 $C_s$ 为负的区域往往表现更差而这部分物理对于模拟的准确性恰恰至关重要。5.2 集成学习显著提升稳定性与精度为了克服单网络的不稳定性和过拟合风险我们采用了集成学习策略。具体来说使用了Bootstrap Aggregating方法从原始训练集中通过有放回抽样创建多个例如10个不同的“Bootstrap”子训练集。在每个子训练集上独立训练一个神经网络。这些网络具有相同的架构但由于数据不同最终学到的参数会有所差异。对于一个新的测试样本让这10个网络分别做出预测。最终的集成预测我们采用中位数Median而非平均值。中位数对个别网络的异常预测离群值不敏感因此更具鲁棒性。效果立竿见影图14对应原文Figure 14对比了集成网络与真实值。可以看到红色虚线集成预测与蓝色实线真实值的贴合程度远优于单网络预测。预测曲线的平滑度和稳定性大大提升。局部改进图15对应原文Figure 15的放大视图展示了集成学习在棘手区域的威力。在测试数据索引1200-1400附近的一个陡峭峰值处单网络预测要么过于平滑要么振荡剧烈。而集成网络无论是简单的8神经元还是复杂的32神经元配置都能给出更紧贴真实值、更稳定的预测轨迹。量化飞跃表VIII对应原文Table VIII的MSE数据令人印象深刻。所有集成网络的MSE都比对应的单网络低1到2个数量级。表现最好的配置32神经元3层达到了惊人的2.49e-8的MSE。这比最好的单网络性能1.82e-6提升了近两个数量级。为什么集成学习如此有效降低方差通过平均多个模型的预测集成学习可以有效减少由于训练数据随机性导致的模型方差。在湍流数据中这种随机噪声和间歇性很强单模型容易受其干扰。降低过拟合风险每个基学习器在不同的数据子集上训练降低了所有模型同时过拟合到训练集特定噪声模式的可能性。扩大假设空间集成模型相当于探索了更广泛的假设空间其最终预测是多个可能解的综合往往比任何一个单模型更接近最优解。实操配置我们在MATLAB中实现了这个Bagging集成。关键步骤包括使用bootstrp函数生成Bootstrap索引对每个网络使用贝叶斯正则化训练函数trainbr自带正则化效果能进一步防止过拟合设定一个MSE阈值如1e-8只选择那些在各自Bootstrap样本上训练误差低于该阈值的网络参与最终的中位数集成。这个“筛选”步骤很重要它剔除了那些训练失败或过拟合严重的“坏”模型。6. 与传统动态模型的对比与优势为了评估我们机器学习模型的实用价值必须将其与行业标准——动态Smagorinsky模型进行正面比较。6.1 动态Smagorinsky模型的原理与痛点DSM的核心思想很巧妙在模拟的滤波尺度之上再施加一个更宽的“测试滤波器”。通过比较两个尺度上的应力关系可以推导出一个动态的、随空间和时间变化的 $C_s$ 公式即原文中的公式10。理论上这能让模型自动适应不同的流态。然而DSM有几个著名的痛点数值不稳定公式10的分母可能接近于零导致 $C_s$ 计算出现极大的正值或负值尖峰。即使进行空间平均或裁剪这些剧烈的波动也常常是数值模拟发散的元凶。计算开销需要额外计算测试滤波后的流场并求解一个关于 $C_s$ 的方程有时还需要在均质方向或局部空间做平均增加了计算成本。对负 $C_s$ 的处理DSM可以产生负的 $C_s$这很好但负值的剧烈波动更难处理常常需要特别的数值处理技巧。6.2 机器学习模型作为“智能滤波器”图16和图17对应原文Figure 16 17的对比非常直观蓝色实线基于生产的“真实” $C_s$这是我们希望逼近的目标。绿色实线DSM预测的 $C_s$。可以看到它确实能捕捉变化趋势但其曲线充满了高频的、大幅度的“毛刺”和尖峰。这些就是导致不稳定的数值噪声。红色虚线我们的集成神经网络预测的 $C_s$。机器学习模型的优势一目了然平滑性与稳定性NN预测曲线非常平滑完全避免了DSM那种灾难性的尖峰。这使得它可以直接用于大涡模拟而无需担心稳定性问题。趋势保真度NN预测并非一味地平滑。它紧密地跟随DSM和真实曲线的主要变化趋势。在图17的放大区域中可以看到在 $C_s$ 快速变化的区域NN预测能及时跟上而在DSM产生异常振荡的地方NN预测则像是一个智能滤波器滤除了不合理的噪声保留了物理上合理的趋势。计算效率一旦训练完成NN模型的前向预测只是一系列矩阵乘法和激活函数计算其计算成本远低于DSM中需要进行的滤波、张量运算和方程求解。在需要大量重复调用 $C_s$ 模型的CFD模拟中这能节省可观的计算时间。本质我们的集成神经网络通过学习高保真数据实际上学到了一个在“物理准确性”由生产定义表征和“数值鲁棒性”之间的最优折衷。它继承了DSM能动态适应的优点同时又具备了传统常数模型或平均化DSM的稳定性。它充当了一个基于数据的、自适应的正则化器。7. 实施要点、常见问题与避坑指南7.1 数据准备与特征工程的陷阱数据质量是天花板“垃圾进垃圾出”在机器学习中永不过时。用于训练的高保真数据如DNS或高分辨率LES本身必须可靠。要检查数据的统计平稳性、收敛性并确保计算域足够大以包含代表性的湍流结构。标签真实Cs的计算必须一致用于生成标签的“真实” $C_s$ 公式基于湍动能生产项必须清晰、一致且与后续评估标准一致。任何不一致都会导致模型学到错误的关系。张量不变量的选择并非所有不变量都有用。需要基于物理理解进行筛选。例如在不可压流动中$I_1$ 接近零可能信息量不大。$Q$ 和 $R$ 是常用的组合但也可以尝试其他组合如 $||\mathbf{S}||^2$ 和 $||\mathbf{\Omega}||^2$。可以通过特征重要性分析如Permutation Importance来辅助选择。邻居尺度的物理意义邻居网格的大小应与亚格子应力的物理作用尺度相关联。一个经验法则是邻居区域的尺寸应大致对应于滤波宽度 $\Delta$ 的若干倍。可以先从 $\Delta$ 的1-2倍开始尝试。7.2 模型训练与调参的实战经验损失函数的选择对于回归任务MSE是标准选择。但如果你的数据中存在少量极端值OutliersMSE会被它们过度影响。可以尝试平均绝对误差或Huber损失它们对异常值更不敏感。学习率与优化器Adam优化器默认参数lr1e-3通常是个好起点。如果训练损失震荡或下降缓慢尝试降低学习率如1e-4。使用学习率调度器如ReduceLROnPlateau在验证损失停滞时自动降低学习率有助于精细调优。验证集是关键务必使用独立的验证集来监控训练过程并用于早停和超参数选择。切勿根据测试集性能来调整模型那会导致对测试集的过拟合高估模型泛化能力。处理类别不平衡在分类任务中如果“大Cs”和“小Cs”样本数量严重不均除了平衡采样还可以在损失函数中使用类别权重给少数类样本更高的权重迫使模型更关注它们。集成学习的细节基模型数量不是越多越好。通常5-10个模型就能获得大部分集成收益。太多模型会增加计算成本而性能提升会边际递减。基模型多样性这是集成有效的核心。除了使用Bootstrap还可以让基模型具有不同的架构如不同层数、神经元数或使用不同的随机种子初始化。集成策略对于回归任务中位数通常比平均值更鲁棒。对于分类任务可以采用投票法。7.3 模型部署与CFD耦合的考量推理速度将训练好的神经网络模型集成到CFD求解器中时必须考虑其前向传播的速度。复杂的网络虽然精度可能略高但推理慢会拖累整个模拟。需要在精度和效率间权衡。可以考虑使用模型剪枝、量化或知识蒸馏等技术来压缩模型。软件接口将Python/PyTorch训练的模型部署到Fortran/C写的CFD代码中需要解决跨语言调用问题。常见做法有使用ONNX格式导出模型并用支持ONNX的运行时库如ONNX Runtime在CFD代码中调用。使用专门的推理库如LibTorchPyTorch的C前端。对于简单的网络甚至可以手动将权重和偏置写出在CFD代码中实现前向传播函数。数值稳定性确保神经网络在推理时不会产生NaN或Inf值。在训练时可以使用梯度裁剪在激活函数后可以添加微小的数值稳定项如对于Softmax。可复现性固定所有随机种子Python, NumPy, PyTorch等确保每次训练和推理的结果是可复现的这对于科学研究至关重要。这项将几何不变性与集成学习结合用于湍流亚格子应力建模的工作为我们打开了一扇新的大门。它证明通过精心设计输入特征来嵌入物理先验并利用集成学习来提升鲁棒性数据驱动的方法不仅能达到、甚至能在稳定性和效率上超越一些传统的动态模型。当然这条路还很长比如如何将这种方法推广到更复杂的几何、非均匀网格、以及包含热效应或燃烧的流动中都是值得深入探索的方向。从我个人的实践来看最大的体会是在物理建模中应用机器学习成功的关键永远在于对物理问题的深刻理解与对机器学习工具的娴熟运用之间的紧密结合。缺了任何一方都难以走到最后。

查看全文

http://www.rkmt.cn/news/1377315.html