当前位置: 首页 > news >正文

统计学习方法学习Day01

学习了统计学习方法的第一章
1.5正则化与交叉验证
(1)正则化的目的是模型选择的一个经典方法,正则化的是要使风险最小化的策略。正则化实在经验风险上加上一个正则化项,正则化项主要是防止模型在训练过程中出现过拟合的现象,一般正则项是由参数向量的L1,L2范式(注:L1是数据集中所有数据的绝对值的和/数据的个数,而L2是数据集中所有数据平方的和开根号/数据的个数)。
正则化为什么可以防止过拟合的数学解释

屏幕截图 2025-10-13 203316

在公式中存在经验损失和正则化项,在选择模型的过程中一般选择经验损失最小的,而要选择最小的损失,我们需要对公式中的所有未知元素求偏导,是他们的偏导等于零从而来获得他们中的极小值,在极小值中进行比较就可以取得最小值.
而在进行上述操作的过程中,我们便可以将其与KKT及非线性规划最优解进行比较,发现正则化和带条件的优化是一致的,从而发现正则化对于模型选择的重要性。
(2)交叉验证便是对模型的检验,在选择好模型后,我们便需要对模型进行训练,测试和验证,这就需要我们将数据分为训练集,测试集和验证集,一般在数据充足的情况下,我们将依次将数据集分为90%,5%,5%给各个集。在验证方法上我们也分为简单验证方法,s折验证方法和留一验证方法。
简单验证方法就是将数据集分为两份,一份交给模型训练,一份交给验证
S折验证方法就是,将数据集分为S分只留一份验证,其余交给模型测试。如图

屏幕截图 2025-10-13 201303

而留一是S折的特殊情况,每一份数据极为一折。

http://www.rkmt.cn/news/20445.html

相关文章:

  • gpt-5-codex vs gpt-5
  • 成员内部类
  • 用 Fortran 进行英文数字验证码识别
  • webpack优化前端性能
  • uml九类例图详解
  • C语言自学--自定义类型:结构体 - 指南
  • 苹果iMessage群发协议,苹果iMessage短信,苹果iMessage推信,iMessage协议版自动群发完美实现。
  • 06-mysql备份实战 #
  • Java 架构师系列:JVM 与 AI 负载的优化策略 - 指南
  • java循环
  • 070_尚硅谷_其它进制转十进制
  • python中修改局部json的思路
  • 部署 GitLab 服务器 - 实践
  • 第十三节:基于 Redis+MQ+DB实现高并发秒杀下的扣减
  • c++初体验
  • 四则运算错题本和错题重做的建立
  • 行列式的性质
  • 04_SQL语句一
  • 详细介绍:【C++】二叉搜索树
  • 20232323 2025-2026-1《网络与系统攻防技术》实验一实验报告
  • Zabbix 6.0+ 运用官方模板监控 Redis 数据库的完整安装指南
  • 【图论】Floyd算法简析
  • perl-Test-Simple-1.302195-5.fc39.noarch.rpm 怎么安装?Fedora 39 安装步骤讲解
  • 麒麟系统中修改 WPS 默认新建文件格式的方法 - 实践
  • 斯坦福ACE框架:让AI自己学会写prompt,性能提升17%成本降87%
  • 讲给 SRE 听 —— 零基础入门 KNN 分类算法【左扬精讲】:SRE 运维场景实战(含余弦相似度)
  • 【终章】:幸福的复利——打造你的每日幸福微习惯 - 指南
  • 完整教程:SQLMap注入学习靶机(打靶记录)
  • 实用指南:Go 语言中的**数组 (Array)*用法
  • 单 Pod DNS 记录(`web-0.nginx.default.svc.cluster.local`)排障与启用