当前位置：首页 > news >正文

【大模型】【扫盲】几种不同的微调方法

news 2026/6/10 20:13:47

四种微调方式

Full

对预训练模型的所有参数进行微调，让模型从底层到顶层的所有参数都参与更新，彻底适配下游任务

优点：模型对任务的适配性最强，在数据充足、任务复杂时效果通常最优
缺点：资源消耗极大（千亿参数模型需高端 GPU 集群，训练时长以天 / 周计）；数据量不足时极易过拟合（模型死记训练数据，泛化能力差）

适用于数据量大，复杂度高，计算资源充足的情景

Freeze

仅微调模型的部分参数（通常是 “顶层” 或新增的任务专属层，如分类头、输出层），冻结大部分底层参数（保留预训练阶段学到的通用知识）
适用于数据量少，任务简单，计算资源有限的场景

LoRA Low-Rank Adaptation

不直接修改预训练模型的原始参数，而是在模型的关键层（如注意力层、前馈网络层）插入低秩矩阵对（可理解为 “小配件”），仅微调这组低秩矩阵，原始模型参数保持冻结

在微调过程中，原始参数全程不更新

优点：训练速度极快、显存消耗极低；效果接近全量微调，且能完美保留原模型知识；支持多任务共享大模型
缺点：
若任务需要 “深度改造” 模型（如极小众领域的知识注入），低秩矩阵可能无法完全捕捉复杂规律，效果略逊于全量微调；
依赖 “低秩假设”，若任务与预训练任务差异过大，适配性会下降

适用于纯文本的任务，多任务场景，边缘设备部署等场景

QLoRA（Quantized LoRA，量化低秩适应）

是 LoRA 的升级版：先对预训练模型进行量化压缩（如 4 位量化，将浮点数参数转为低精度整数），再在量化后的模型上应用 LoRA 方法，仅微调新增的低秩矩阵

适合用在资源极其紧张的场景

查看全文

http://www.rkmt.cn/news/25601.html

在 wrapper 类里实现重载方法

Vue 项目 AI 文档增量更新工具操作手册

P7521 [省选联考 2021 B 卷] 取模分析

实用指南：socketpair深度解析：Linux中的“对讲机“创建器

嵌入式硬件——基于IMX6ULL的UART（通用异步收发传输器） - 教程

CSP-S 模拟赛 Day 19

CSP-S 模拟赛 Day 18

2025年市面上高杆灯品牌与国内公司口碑产品推荐榜单

2025年锥芯板品牌口碑排行榜单Top10：行业精选与选择指南

Boost 搜索引擎 - 实践

P11233 [CSP-S 2024] 染色题解

hive udaf 输入输出处理参考手册 - 指南

位运算（早晚得学会）

深入解析：【C++】继承

20231427田泽航第五周预习报告

利用错误配置的postMessage()函数实现DOM型XSS攻击

机器学习领导者分享AI技术与行业洞见

el-upload上传配合$confirm使用的问题

10.20 CSP-S模拟35 改题记录

例子：vue3+vite+router创建导航菜单

LGR-246 解题报告

（薛定谔のCSP-S）模拟35 2025.10.20

CSP-S模拟36

追忆

luogu P14259 兄妹（siblings）

10月20日

结对项目--小学四则运算题目生成器

阿里云智能语音简单使用：语音识别

四种微调方式

Full

Freeze

LoRA Low-Rank Adaptation

QLoRA（Quantized LoRA，量化低秩适应）

相关文章：