当前位置: 首页 > news >正文

多组学生物衰老时钟!高精度、可解释、可扩展

摘要

精准量化生物年龄对慢性病的早期风险分层与干预至关重要。本研究基于英国生物银行30,376名受试者的大规模血浆蛋白质组与代谢组数据,构建了集成学习生物衰老时钟StackAge。该模型年龄预测精度极高(与时序年龄皮尔逊相关系数r≈0.93),并显著提升12种慢性病的风险预测效能,其中2型糖尿病、阿尔茨海默病、肾病的预测AUC超0.90。纳入衰老速率可在传统组学与人口学特征基础上持续改善疾病预测效果。特征解析与通路富集显示,衰老相关标志物富集于炎症、应激、细胞外基质重塑通路。中介分析表明,可改变的生活方式因素可加速生物衰老,进而升高心血管、神经、免疫、肌肉骨骼疾病的发病风险。本研究建立了稳健的多组学框架,可量化个体生物年龄,为精准预防与健康管理提供具备临床价值的生物年龄指标。

lixg@shsmu.edu.cn

xqzheng@shsmu.edu.cn

yfqin@shou.edu.cn

#生物衰老时钟 #多组学整合 #集成学习 #疾病预测 #可解释性 #SHAP #英国生物银行 #衰老轨迹 #年龄相关疾病

结果

研究设计与分析框架

1StackAge的研究设计与分析框架概览

(a) 对英国生物银行30376名受试者的多组学数据(2923种蛋白质、251种代谢物)进行预处理与特征筛选;根据疾病状态分为健康组(n=16078)与疾病组(n=14298),通过SHAP值排序3175个特征,选取前300个用于模型构建。

(b) StackAge整合线性回归、LightGBM、弹性网作为基学习器构建生物年龄预测模型;个体衰老速率 = 预测生物年龄/时序年龄。

(c) 结合衰老速率、组学与人口学变量,预测12种慢性病5/10/15年发病风险。

(d) 结构方程模型评估衰老速率在生活方式与疾病风险间的中介效应。

模型性能评估与衰老速率人群差异

2模型性能评估与衰老速率的人群水平差异

(a) 蛋白质组、代谢组特征对年龄预测的贡献(SHAP排序前50–800个特征)。

(b) 不同组学输入的模型性能对比;整合StackAge用286种蛋白+14种代谢物,单蛋白质组用前300个SHAP特征,单代谢组用全部251种代谢物。

(c) StackAge与已发表衰老时钟、机器学习/深度学习基线模型的性能对比。

(d) 不同种族的预测衰老速率分布。

(e) 不同性别的预测衰老速率分布。

(f) 44–75岁六6个时序年龄组的衰老速率累积分布。

衰老速率对年龄相关疾病的预后价值

3按衰老速率分层的12种慢性病累积发病率

Kaplan-Meier曲线展示缺血性心脏病、2型糖尿病、帕金森病、阿尔茨海默病、高血压、癌症、肺气肿、慢性肾病、类风湿关节炎、黄斑变性、骨质疏松症、骨关节炎的年龄别发病率;对比衰老速率最高10%(红)与最低10%(蓝)受试者,阴影为95%置信区间。

基于衰老速率与多组学特征的疾病风险预测

4衰老速率联合多组学特征的疾病风险预测效能

(a) 4种模型5年发病预测性能对比;模型1:蛋白质组+代谢组+人口学+衰老速率;模型2:蛋白质组+代谢组+人口学;模型3:蛋白质组+代谢组;模型4:仅蛋白质组。点为10折交叉验证AUC,空心圆为均值,小提琴图展示折间分布。

(b–l) 12种慢性病的预测AUC(0.54–0.93)。

衰老相关蛋白的功能解析

5衰老相关蛋白的功能富集与差异表达分析

火山图展示疾病组与健康组衰老相关蛋白的差异表达(基于对数倍变化和Welch t检验P值);按|log₂FC|×(-log₁₀P)综合评分排序,标注前10个上调蛋白(橙色)、前5个下调蛋白(蓝色)。

衰老速率的可调控中介作用

6生活方式、生物衰老与慢性病的关联分析

(a) 热图展示3个年龄层(40–49、50–59、60–69岁)中,各生活方式组间生物年龄差异的显著性;颜色深浅代表P值大小,星号为显著性水平。

(b) 不同生活方式组的生物年龄估计差值;点为组均值,横线为95%置信区间,标注Cohen’s d效应量。

(c) 显著的「生活方式→衰老速率→疾病」中介通路。

(d) 衰老速率介导生活方式对12种疾病间接效应的矩阵。

数据和代码

原始个体水平数据来自英国生物银行,受数据使用协议限制无法公开共享;可向英国生物银行获取委员会提交正式申请获取数据权限,本研究申请编号116409

https://www.ukbiobank.ac.uk/

分析代码与衍生数据(含衰老时钟模型)已托管至GitHub仓库

https://github.com/PeterJiang122/JYY_AgeClock_20260205/releases/

要点

  • StackAge是款基于集成学习的生物衰老时钟,整合英国生物银行的大规模血浆蛋白质组与代谢组数据,可高精度估算个体生物年龄及衰老速率。

  • StackAge采用堆叠集成架构,融合线性回归、弹性网络、LightGBM基学习器与XGBoost元学习器,预测性能优异(与时序年龄的相关系数r≈0.93),优于现有单一组学及传统衰老时钟。

  • 模型推导的衰老速率在12种年龄相关慢性病中均展现出稳定的预后价值,可显著提升5年、10年及15年随访期的疾病风险预测效果。

  • 中介分析表明,可改变的生活方式因素部分通过加速生物衰老影响疾病发生风险,证实衰老速率是连接生活方式与疾病易感性的潜在机制纽带。

详细总结

思维导图

参考

Brief Bioinform. 2026 May 4;27(3):bbag271. doi: 10.1093/bib/bbag271.

StackAge: an ensemble-based clock for precise quantification of biological age using multi-omics data

260531StackAge.pdf

注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。

http://www.rkmt.cn/news/1466078.html

相关文章:

  • http-server-o.bat 最方便启动当前目录的index.html
  • 用Python搞定PHM 2012轴承数据集:从数据下载到特征提取的保姆级教程
  • # 常州轮胎维修哪家好?金坛薛埠汽修门店实测解析|竞品对比+轮胎选购避坑全攻略 - 国麟测评
  • 点按钮下载
  • 独立显卡市场2026:一线品牌显卡有哪些格局再界定
  • 数字化转型标杆案例:信旅房车全域数字化升级,重构房车连锁新范式
  • 终极浏览器资源嗅探解决方案:猫抓Cat-Catch技术深度解析与实战指南
  • 2026 邹城防水补漏哪家好?住建实地测评权威榜单 TOP5|东部低山丘陵 / 中部缓坡岗地 / 西部白马河泗河冲积洼地、邹城经开区渗漏修缮白皮书(6 月专项调研) - 苏易修缮
  • 纳米砂磨机工作原理、应用场景与选型入门(2026版) - 上海奎特机电
  • 850nm 红外补光 + 深度传感,一文看懂 Windows Hello 硬件架构
  • 黄金回收警惕三大细节,嘉兴桐乡市今日金价行情与合理报价区间 - 上门黄金回收
  • 从攻击到防御:基于快马ai生成dvwa文件上传漏洞的完整实战案例剖析
  • Basys 3双板无线钢琴系统:即载即用的发射/接收bit文件包
  • 2026花都区专利代理TOP3测评|专利补贴新政全解析、汽车零部件皮具美妆智造资助标准、空港经济科创扶持、高企专精特新申报加分、全年申报批次流程、专利避坑指南与本土制造企业落地案例大全 - 资讯速览
  • Whisper语音识别轻量化微调与跨平台部署工具集(Android/Windows/服务端全支持)
  • MuleSoft+LangChain企业级AI编排实战:数据集成与大模型协同
  • GNSS信号频点命名的秘密:从L波段到‘无线电窗口’,一次讲清导航信号为什么选这个频率
  • 给TMS320F28379D新手:手把手教你配置外部GPIO中断(附代码避坑)
  • MATLAB版DTLZ多目标测试函数全集(含9个标准函数+8种前沿形态变体)
  • Java后端做RAG:从4步入门到文档入库实战
  • [智能体-255]:Retriever:RAG 核心底座、实现各类 RAG 的统一标准组件
  • Altium Designer新手必看:PCB设计里那些烦人的绿色报错,到底怎么一键搞定?
  • 深入glibc源码:图解_dl_fixup如何解析动态链接函数(附ret2dlresolve利用原理)
  • 零基础入门:在快马平台上手YOLOv8目标检测第一课
  • 告别卡顿与闪退:Quartus II 13.1在Win10/Win11下的稳定运行与性能优化配置全攻略
  • MATLAB行星齿轮动力学仿真脚本:含ode45求解器与完整系统建模函数
  • 别再只调参了!遗传算法解VRP时,这3个编码细节才是性能关键
  • MinerU2.5 Pro技术解析:1.2B参数SOTA PDF解析模型,完整部署教程(Transformers/vLLM/SGLang/Docker)
  • 给Jetson Nano B01换颗‘中国心’:手把手教你配置清华源并安装Python全家桶
  • C#上位机开发笔记:封装一个稳定可靠的欧姆龙NX PLC通信类库(附源码)