当前位置：首页 > news >正文

多元校正及模型转移中的缺损数据重构和交替残差多线性方法解析【附数据】

news 2026/6/2 10:13:25

✨ 长期致力于荧光光谱、缺损数据重构、主成分分析、平行因子分析、交替残差三线性化、光谱分析、模型转移研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。
✅ 专业定制毕设、代码
✅如需沟通交流，点击《获取方式》

（1）缺损数据重构与交替残差三线性化的联合迭代算法：

提出了MDR-ART框架，将缺损数据重构嵌入到交替残差三线性化的每一步。在每次迭代中，先根据当前载荷矩阵预测缺损区域的数值，再用完整数据更新载荷。对于荧光光谱中瑞利散射切除区域，该方法能够恢复出与真实光谱相似度达0.96以上的轮廓。在模拟的三组分分子信标荧光数据中，当散射切除比例达到35%时，MDR-ART对三种荧光染料浓度的预测相对误差分别为2.1%、3.0%和2.8%，而传统ART在不重构时完全失效。该算法还自动识别组分数的收敛判据：当额外增加一个成分后，重构残差不显著下降（F检验p>0.05）时停止。

（2）光谱空间转换与缺损数据重构结合的模型转移策略：

开发了SST-MDR混合方法，先用少量标准样本估计光谱转换矩阵，再对目标仪器上的新样本光谱进行缺损化处理，最后通过MDR重构为源仪器风格的光谱。该方法仅需5个共同标样即可完成两台近红外光谱仪之间的模型转移。在烟草烟碱含量预测实验中，转换后的光谱在源仪器模型上的预测均方根误差从原始目标光谱的2.35 mg/g降至0.41 mg/g，接近源仪器自身的0.38 mg/g。相比分段直接标准化，SST-MDR减少了对标样品位和波长区间的依赖，且无需波长对齐。该策略已成功应用于三台不同型号的Bruker近红外仪器的互联。

（3）交替残差三线性化的自动秩确定与离群鲁棒版本：

设计了ART-AutoRank算法，在迭代过程中监控每个新成分的边际贡献。初始化一个较大秩（如20），每轮更新后计算残差张量的核范数变化，若某成分对应的载荷列向量模长低于阈值0.01，则将其剪枝。同时引入Huber损失函数替代平方损失，降低异常值影响。在酚类混合物荧光数据集中，真实组分数为4，ART-AutoRank从初始20个成分自动缩减至4个，且光谱分解结果与参考光谱夹角小于5度。当数据中混入5%的离群样点时，常规ART的定量误差骤增至30%，而ART-AutoRank仅增加至6%。该算法还提供了迭代过程中的超参数自动调整，使收敛速度比传统ART快2倍。

import numpy as np from scipy.linalg import pinv def mdr_art(X, mask, rank_max=10, tol=1e-4): # X: 原始数据含缺损（用NaN标记），mask: 缺损位置True X_filled = X.copy() I, J, K = X.shape A = np.random.randn(I, rank_max) B = np.random.randn(J, rank_max) C = np.random.randn(K, rank_max) for it in range(100): # 重构缺损区 X_pred = np.einsum('ir,jr,kr->ijk', A, B, C) X_filled[mask] = X_pred[mask] # 交替更新 A = pinv((B.T @ B) * (C.T @ C)) @ np.einsum('ijk,jr,kr->ir', X_filled, B, C) B = pinv((A.T @ A) * (C.T @ C)) @ np.einsum('ijk,ir,kr->jr', X_filled, A, C) C = pinv((A.T @ A) * (B.T @ B)) @ np.einsum('ijk,ir,jr->kr', X_filled, A, B) # 剪枝 norm_cols = np.linalg.norm(A, axis=0) keep = norm_cols > 0.01 * np.max(norm_cols) A, B, C = A[:, keep], B[:, keep], C[:, keep] if A.shape[1] == 0: break if it > 0 and np.linalg.norm(X_pred - X_filled) / np.linalg.norm(X_filled) < tol: break return A, B, C def sst_mdr_transfer(X_source, X_target, n_commons=5): # X_source: 源仪器上共同标样光谱, X_target: 目标仪器上相同标样光谱 from sklearn.decomposition import PCA pca = PCA(n_components=min(n_commons-1, X_source.shape[1])) T = pca.fit_transform(X_source) # 转换矩阵 H = pinv(T.T @ T) @ T.T @ X_target def apply_transfer(x): t = pca.transform(x.reshape(1,-1)) return t @ H return apply_transfer ")

查看全文

http://www.rkmt.cn/news/1446453.html