当前位置: 首页 > news >正文

11.12记录-机器学习

# 11.12记录

决策树

决策树也是机器学习的关键算法之一。也是XGBoost算法的基本构成单元。决策树是一个树形结构,如下图所示

image-20251112155347534

有个线上小游戏叫做akinator(网络精灵),这个就是一个类似决策树的东西。

特征选择

特征选择是选择出那些具有分类能力的特征,好的特征选择可以规避很多问题,例如维度灾难(指的是由于有太多的特征,导致每个特征最深处的叶子节点可能只有几个样本),过拟合,复杂模型等。不同算法衡量特征选择的方法也不一样。

ID3

ID3算法计算原本样本的熵,然后计算条件熵(就是原来的样本集合经过特征选择之后的熵),然后原来的熵减去条件熵就是信息增益。ID3算法每次选择信息增益最高的特征来作为父节点,然后对该特征每个可能的取值生成一个叶子节点,循环往复。ID3偏向选择取值较多的特征。

C4.5

C4.5算法和ID3类似,不过C4.5用的是信息增益比,就是信息增益/数据集D以特征F作为随机变量的熵

CART

是XGboost的重要组成部分。采用二分递归,所以树是二叉树。

剪枝

剪枝是决策树中很重要的部分,因为不剪枝可能会造成过拟合的情况,当然剪枝太多也会造成欠拟合

预剪枝

分裂之前先对节点进行评估,如果可以使得模型泛化能力增加,那么就分裂,不然不分裂。

后剪枝

先构造完一颗完整的决策树,然后从底向上对叶子进行评估,如果非叶子节点剪掉有利于提升,则剪掉子树。

http://www.rkmt.cn/news/47687.html

相关文章:

  • 个人工作版(Linux)
  • 2025年耙式真空干燥机优质厂家权威推荐榜单:耙式干燥机/ZB系列耙式真空干燥机/真空耙式干燥机源头厂家精选
  • 习题解析之:输出 n 以内的所有素数
  • 2025年重庆吊装搬运公司权威推荐榜单:工厂搬迁/搬运/搬运设备源头公司精选
  • 新手入门常用的Dos命令
  • 到底是用vue2还是vue3好?
  • 避免在C#循环中使用await 改用WhenAll - 尼古拉
  • P12213 [蓝桥杯 2023 国 Python B] 最长回文前后缀 题解 字符串哈希+二分
  • 智能充气泵方案:充气泵pcba功能结构组成
  • 习题解析之:最大素数
  • mybatis-plus Wrappers相关Api
  • 塔城西林瓶灌装线厂家提供使用技巧培训助提效
  • VMware-配置静态IP地址详细教程
  • OI教练模拟器自动刷天赋脚本!
  • BM3D 图像降噪快速算法的 MATLAB 实现
  • v4l2 probe时各个device的操作顺序
  • 国泰君安基于隐语SecretFlow生产场景探索实践
  • 鲜花:m 群 bot 随机一言摘抄
  • MATLAB小波分析工具包进行时间序列的小波功率谱分析
  • 再次出山!!
  • 完整教程:Java 反射机制核心类详解:Class、Constructor、Method、Field
  • Problems
  • Java 获取 Excel 中工作表的名称 - 指南
  • 2025年现代风格卫生间隔断生产厂家权威推荐榜单:易清洁卫生间隔断/欧式卫生间隔断/养老院卫生间隔断源头厂家精选
  • 2025年排渣阀订制厂家权威推荐榜单:陶瓷阀门/搪瓷阀门/铸铁阀门源头厂家精选
  • Aoao Round 2 比赛总结
  • 11.12 联考总结
  • 揭开时序数据库的秘密:为何它是数据存储的未来?
  • 2025/11/9
  • macOS 下载汇总 (系统、应用和教程) - macOS Tahoe 26