尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

统计学习方法学习Day01

统计学习方法学习Day01
📅 发布时间:2026/6/19 21:34:04

学习了统计学习方法的第一章
1.5正则化与交叉验证
(1)正则化的目的是模型选择的一个经典方法,正则化的是要使风险最小化的策略。正则化实在经验风险上加上一个正则化项,正则化项主要是防止模型在训练过程中出现过拟合的现象,一般正则项是由参数向量的L1,L2范式(注:L1是数据集中所有数据的绝对值的和/数据的个数,而L2是数据集中所有数据平方的和开根号/数据的个数)。
正则化为什么可以防止过拟合的数学解释

屏幕截图 2025-10-13 203316

在公式中存在经验损失和正则化项,在选择模型的过程中一般选择经验损失最小的,而要选择最小的损失,我们需要对公式中的所有未知元素求偏导,是他们的偏导等于零从而来获得他们中的极小值,在极小值中进行比较就可以取得最小值.
而在进行上述操作的过程中,我们便可以将其与KKT及非线性规划最优解进行比较,发现正则化和带条件的优化是一致的,从而发现正则化对于模型选择的重要性。
(2)交叉验证便是对模型的检验,在选择好模型后,我们便需要对模型进行训练,测试和验证,这就需要我们将数据分为训练集,测试集和验证集,一般在数据充足的情况下,我们将依次将数据集分为90%,5%,5%给各个集。在验证方法上我们也分为简单验证方法,s折验证方法和留一验证方法。
简单验证方法就是将数据集分为两份,一份交给模型训练,一份交给验证
S折验证方法就是,将数据集分为S分只留一份验证,其余交给模型测试。如图

屏幕截图 2025-10-13 201303

而留一是S折的特殊情况,每一份数据极为一折。

相关新闻

  • gpt-5-codex vs gpt-5
  • 成员内部类
  • 用 Fortran 进行英文数字验证码识别

最新新闻

  • Ascend大模型预训练实战:硬件适配、数据对齐与梯度防控
  • Redis Memory Analyzer与Python集成:API使用详解
  • 2026十大离婚律师综合口碑榜单,价格透明服务优质精选 - mypinpai
  • 深入解析S12XDBG硬件调试模块:从比较器、状态机到复杂断点实战
  • 从环境变量到密码安全:Aero处理敏感配置的完整方案
  • CANN/ge获取HCCL跟随流数量

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号