当前位置: 首页 > news >正文

第二讲下梯度下降算法

梯度下降算法

梯度下降有时会使loss不降反而上升原因是:
核心结论是:loss 上升主要源于学习率过高、数据 / 特征问题或模型设置不当,导致优化偏离最优方向。

关键原因

  1. 学习率过大:步长超过最优解范围,每次更新都跳过最小值,甚至远离。
  2. 数据 / 特征问题:数据未归一化(特征尺度差异大),或存在大量噪声、异常值,干扰梯度计算。
  3. 模型设置不当:网络过深导致梯度消失 / 爆炸,激活函数选择不合理(如输出层用 ReLU 处理回归问题),或正则化强度过高。
http://www.rkmt.cn/news/58525.html

相关文章:

  • 11.23
  • Java云计算技术如何确保稳定
  • 二分查找刷题总结
  • zjoi2019 语言
  • 2025-07-21-Mon-T-RocketMQ
  • P24_现有网络模型的使用及修改
  • 20232403 2025-2026-1 《网络与系统攻防技术》实验六实验报告
  • 【计算机网络】深入浅出DNS:网络世界的地址簿与导航系统 - 教程
  • 2025-01-24-Fri-T-如何做一个开源项目
  • 利用大语言模型分析技术支持诈骗Facebook群组的网络犯罪研究
  • [CISCN 2022 华东北]duck WP
  • 20232320 2025-2026-1 《网络与系统攻防技术》实验六实验报告
  • 2025-01-14-Tue-T-实体关系图ERD
  • HTML游戏创建:利用视频作为特效自动播放的方法
  • 第四章-Tomcat线程模型与运行方式 - 指南
  • 11-24
  • 2023-10-15-R-如何阅读一本书
  • 2023-09-19-R-金字塔原理
  • 11-18
  • 11-12
  • 11-11
  • 苹果app开发上架流程
  • P14566 【MX-S12-T1】取模
  • 洛谷 B4357:[GESP202506 二级] 幂和数 ← 嵌套循环
  • PySpark - MinMaxScaler
  • ubuntu 无网络连接/无网络标识解决方法
  • P14134 【MX-X22-T5】「TPOI-4E」Get MiN? Get MeX!
  • 使用injected Provider在remix中调试合约的坑 -- 时间(或者最新块)更新不及时 - 详解
  • 2025年必收藏的8款AI论文写作神器!助你高效搞定学术写作
  • bfs dfs板子默写 真的好怕像上次一样这种题AC不了啊