当前位置: 首页 > news >正文

SGD优化器贯穿Faster R-CNN的全模型

统一管理所有可训练参数的更新,而非作用于某个局部模块。

一、全局视角:SGD管理哪些参数?

Python
复制
# Faster R-CNN可训练参数总览
model = FasterRCNN(backbone=ResNet50(),      # 包含 conv1~conv5_x, BN层rpn=RPNHead(),            # 包含分类/回归分支的卷积roi_heads=RoIHeads(),     # 包含全连接层、分类器
)# 所有参数由同一个SGD优化器管理
optimizer = optim.SGD(params=[# 1. Backbone参数 (C1~C5卷积){'params': model.backbone.parameters()},# 2. RPN参数 (anchor分类/回归){'params': model.rpn.parameters()},# 3. RoI Head参数 (检测头){'params': model.roi_heads.parameters()},],lr=0.02,momentum=0.9,weight_decay=1e-4
)
 
一句话 :SGD的 step() 每次更新整个Faster R-CNN的权重,从 backbone 底层卷积到 RoI Head 的分类器。

二、训练流程中的SGD位置

完整训练循环

Python
复制
for epoch in range(12):for images, targets in dataloader:# 1. 前向传播 (所有模块共同参与)#    - Backbone提取特征#    - RPN生成proposals#    - RoI Head预测类别/框loss_dict = model(images, targets)losses = sum(loss_dict.values())  # 总损失# 2. 反向传播 (计算所有模块的梯度)optimizer.zero_grad()losses.backward()#    ↓#    梯度已存储在每个参数的 .grad 属性中#    model.backbone.conv1.weight.grad#    model.rpn.conv.weight.grad#    model.roi_heads.box_predictor.weight.grad# 3. 参数更新 (SGD一步更新所有模块)optimizer.step()#    ↓#    所有参数同步更新:#    backbone.conv1.weight -= lr * grad#    rpn.conv.weight -= lr * grad#    roi_heads.box_predictor.weight -= lr * grad
 
SGD作用位置图:
复制
损失函数↓ (backward)
梯度传播到每个参数↓
├─→ Backbone (ResNet)  ← SGD更新
├─→ RPN Head           ← SGD同步更新
└─→ RoI Head           ← SGD同步更新
http://www.rkmt.cn/news/74810.html

相关文章:

  • 「C++」vector的利用及接口模拟详解
  • Android开发 Jetpack_Compose DatePickerBottomSheet 滚轮日历选择器对话框
  • 代码资源空间调整:当前代码与资源的总大小超过FLASH的大小,需要更大的FLASH
  • 亚马逊发起新的Alexa Prize SimBot挑战
  • 制造业图文档收发的安全交换解决方案分析
  • 从经验驱动到模型驱动:企业数字化的机理、难题与价值重构
  • 2025年客制化键盘王者:狼蛛双雄领衔,五强争霸颠覆市场格局
  • WPF CommunityToolkit.Mvvm学习-一ObservableProperty 属性
  • P2542 [AHOI2005] 航线规划の题解
  • host
  • 可视化图解算法72:斐波那契数列
  • 高中学习机挑选三步法:锁定这三大维度,快速找到你的“学霸机”
  • 多项式学习笔记
  • Kubernetes(K8s):核心概念、架构与实战应用全解析
  • 2025年12月美国投行求职机构哪家好:数据揭晓98%靠谱专业的机构
  • 4. 垃圾回收机制(GC)
  • 2025年丰田凯美瑞更换轮胎推荐:权威轮胎推荐必读攻略
  • 2025年操控的轮胎推荐:十大操控胎深度解析
  • 第3章栈和队列
  • 运动补偿中的距离对准技术:原理、方法与应用
  • 记一次Sqlserver数据库存储过程调用导致的连接池耗尽事件
  • 2025/12/6下午计划
  • 2025年下半年上海ISO27001认证机构综合评估与选择指南
  • 2025年下半年上海ISO27001认证平台口碑排行榜
  • 多级隐马尔可夫模型研究新进展
  • 信仰是为了虚幻之人
  • 从功能堆砌到体验至上的蜕变之路:兰亭妙微如何助力臻选生活馆实现小程序重生与业绩倍增
  • 2025年水族铝型材推荐厂商TOP5权威评选:口碑好的水族铝
  • 预见未来!兰亭妙微发布2026年用户体验设计三大趋势与企业应对策略
  • 结合人脸识别和实名认证的校园论坛架构 校园活动报名系统