当前位置: 首页 > news >正文

concat graph构造

在蛋白质图神经网络(Protein GNN)中,"concatgraph"(拼接图)通常指将多种异构特征拼接后作为图的初始表示,而不是某种固定维度的标准图。它的构造方式主要分为三个层面:节点特征拼接边特征拼接、以及图/多模态级别拼接


1. 节点特征拼接(最常见)

这是最核心的构造方式。每个残基(Residue)作为图的一个节点,其初始特征向量由多种来源拼接而成:

特征类型 典型维度 内容
序列编码 20 / 25 20 种标准氨基酸的 one-hot;有时加 5 个特殊 token(未知、缺失等)
物化性质 4–10 疏水性、电荷、极性、分子量、芳香性等
预训练语言模型嵌入 320 / 640 / 1024 / 1280 ESM-2、ProtT5、ProtBert、SeqVec 等
结构特征 6–10+ 二面角(φ, ψ, ω)的正弦/余弦;Cα 坐标、二级结构等

典型构造示例:

  • GVP + LLM 分类器:节点特征 = DistilProtBert 嵌入(1024 维)拼接 二面角正弦/余弦(标量)+ 相邻 Cα 单位向量(向量)
  • PepLM-GNN:节点特征矩阵由肽和蛋白质的 ProtT5 嵌入直接拼接 而成,使每个节点携带完整序列语义信息
  • PPI 预测:节点使用 ProtBert/SeqVec 的残基级嵌入,替代传统 one-hot + 物化性质,再输入 GCN/GAT

关于你提到的 L×9 vs 20×9:如果 "9" 指物化性质维度,一种常见做法是 20 (one-hot) + 9 (物化性质) = 29 维 的节点特征;也有工作将 20 维 one-hot 与 9 维特征分别处理后再拼接。L 是序列长度,因此 L×29 是更常见的节点特征矩阵形状。单纯 "20×9" 不太常见,除非是某种特定的外积或邻接矩阵构造。


2. 边特征拼接

边通常基于 Cα-Cα Contact Map(如 10 Å 截断)或 K-近邻 构建,边特征也会拼接多种信息:

  • 距离编码:RBF 高斯基函数(如 16 维,覆盖 0–20 Å)
  • 序列位置编码:残基在序列上的距离 |i-j|(反映一维顺序)
  • 方向向量:连接两个 Cα 的单位向量(向量特征)

3. 图级别 / 多模态拼接

在更高层次,"concatgraph" 也指将不同图或不同模态的表示拼接:

拼接层级 做法 示例
多子图嵌入拼接 对同一蛋白构建多个语义子图(如 GO Molecular Function 图 + Cellular Component 图),分别过 GNN 后将节点嵌入拼接 并行 GNN 架构
多尺度层拼接 将 GNN 每一层的 READOUT 输出拼接,形成最终图表示 SICGNN 各层 GIN 输出拼接
蛋白-配体/肽拼接 分别编码蛋白图和配体图,将两个图级向量拼接后做预测 GNNAS-Dock、BridgeDPI 等
序列+结构拼接 图编码的结构表示与 CNN/Transformer 编码的序列表示拼接 X-DPI 中蛋白图与 TAPE 序列嵌入拼接

总结:一般构造流程

输入:蛋白质序列 / PDB 结构│▼
┌─────────────────┐
│ 节点特征构造     │  ← 拼接 one-hot / 物化性质 / ESM嵌入 / 结构特征
│ (残基级)        │
└─────────────────┘│▼
┌─────────────────┐
│ 边构造           │  ← Contact Map (Cα-Cα < 10Å) 或 KNN
│ (空间/序列邻居)  │  ← 边特征:距离RBF + 序列距离 + 方向向量
└─────────────────┘│▼
┌─────────────────┐
│ GNN 消息传递     │  ← GCN / GAT / GIN / GVP
│ (多层)          │
└─────────────────┘│▼
┌─────────────────┐
│ 输出拼接 (可选)  │  ← 多层输出拼接 / 多图拼接 / 与其他模态拼接
└─────────────────┘

如果你提到的 "L×9" 或 "20×9" 来自某篇具体论文或课程讲义,提供上下文后我可以帮你精确解读那个特定工作中的维度定义。

http://www.rkmt.cn/news/1496125.html

相关文章:

  • Flowframes完整教程:从零开始掌握视频插帧技术,让视频流畅度翻倍!
  • 2026资质筑基技术赋能深耕实体:融景科技打造花都GEO优化服务标杆 - 广东科技观察
  • 告别‘马赛克’边缘:手把手用DeepLabV3+实现图像分割的精细优化(附TensorFlow/PyTorch配置)
  • 2026年西安汽车音响改装市场格局与服务机构能力分析 - 优质品牌商家
  • 项目启动之相关方分析
  • Java项目安全管理看这篇就够了!
  • 别再纠结选哪个了!手把手教你用Qt和C#快速搭建一个简易SCADA监控界面
  • 语义主权时代——2026年GEO服务商全球选型战略指南 - GEO优化
  • Spring源码速成,看这篇就够了!
  • i.MX6接口时序设计实战:从SD卡、以太网到显示接口的硬件与驱动配置
  • 2026年更新:山东企业绩效薪酬咨询优选——上海创锟企业管理咨询有限公司深度解析 - 2026年企业资讯
  • 2026天河区搬家公司权威测评|零加价实景实测+全域价格表+商圈专属避坑全攻略 - gzdjxd
  • 当SingleR不给力时:手把手教你用Seurat和文献Marker基因手动注释细胞类型
  • 2026年6月正规的青岛采光井防水补漏公司有哪些推荐 现浇混凝土/玻璃采光顶/地下室采光井公司选择指南 - 海棠依旧大
  • 从“制造高地”到“AI认知高地”——2026年合肥企业GEO选型实战指南 - GEO优化
  • 2026年制造业温控设备供应厂家:精准温控与品质保障实力解析 - 企业推荐官【官方】
  • YOLO26涨点改进| TPAMI 2026顶刊| 独家卷积注意力改进篇 | 引入CCCA循环一致性交叉注意力模块,生成更可靠、更聚焦的视觉提示,助力YOLO目标检测、小目标检测、图像分割任务高效涨点
  • 2026年新消息:南京施工合同纠纷处理新趋势,律师蒋晓峰的专业选择指南 - 2026年企业资讯
  • 从OFDM仿真到5G NR:深入聊聊LMMSE信道估计中那个关键的‘自相关矩阵’到底怎么来的
  • 告别DQN的离散局限:用DDPG和TD3搞定机器人连续动作控制(附PyTorch实战代码)
  • 四川及成都奢侈品回收服务商综合评估与选择指南(2026版) - 优质品牌商家
  • 告别Windows资源管理器中APK文件图标混乱的3个简单步骤
  • 实战指南:如何让老旧Mac重获新生——OpenCore Legacy Patcher深度解析
  • 期货量化主力换月程序怎么移仓:天勤 underlying_symbol 与任务切换
  • 2026年6月隔热板/绝缘板/保温板供应厂家:高效防火与节能环保全解析 - 企业推荐官【官方】
  • 成都楼梯市场主流产品与定制服务综合观察:2026年行业研究报告 - 优质品牌商家
  • 2026深圳全屋定制避坑全攻略,找木点点零增项不踩雷 - 产品测评官
  • i.MX 93 FlexSPI时序配置:从原理到硬件设计的稳定通信指南
  • 2026年探索千户苗寨:情侣游特色旅行社深度推荐与选择指南 - 2026年企业资讯
  • i.MX25外设时序详解:从LCDC到ADC的嵌入式系统稳定运行指南