尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

大模型量化-rr

大模型量化-rr
📅 发布时间:2026/7/2 5:08:44

from awq import AutoAWQForCausalLM
from transformers import AutoTokenizer

model_path = "./Qwen3.6-27B" # 替换为你下载的原始模型路径
quant_path = "./models/Qwen3.6-27B-AWQ-Local"

# 1. 加载模型与分词器
model = AutoAWQForCausalLM.from_pretrained(model_path, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

# 2. 配置 AWQ 量化参数
quant_config = {
"zero_point": True,
"q_group_size": 128,
"w_bit": 4,
"version": "GEMM"
}

# 3. 执行量化(这一步极度消耗内存,请盯紧系统资源)
print("开始本地量化,请耐心等待...")
model.quantize(tokenizer, quant_config=quant_config)

# 4. 保存量化后的模型
print("保存量化模型中...")
model.save_quantized(quant_path)
tokenizer.save_pretrained(quant_path)
print("本地量化完成!")

相关新闻

  • MES如何对接PLC?从OPC UA、Modbus到MQTT,一文讲透设备数据采集架构(附系统架构图)
  • 拍卖系统架构拆解:从用户端到竞价引擎需要哪些核心功能?
  • 打爆散度、旋度、梯度的小狗头

最新新闻

  • 关于人工智能辅助驾驶
  • 国产鼎讯 DXA-601:以 “芯” 动力,护航能源光缆抢修
  • Sunshine游戏串流主机:如何用3步打造你的私人游戏云服务
  • 企业级文本到SQL技术:CSR-RAG高效检索系统解析
  • 计算机毕业设计之基于混合推荐的图书推荐系统的设计与实现
  • 从零发布 npm 包:AI编程工具实战 5 步完成私有仓库配置与版本发布

日新闻

  • Python Playwright录制功能:从零到一构建自动化测试脚本
  • 如何用开源工具永久保存你心爱的小说:novel-downloader全攻略
  • In-Context Learning不是教知识,而是模式对齐:从5个示例到100个工业级样本的真相

周新闻

  • Windows字体自定义终极方案:No!! MeiryoUI完全指南
  • Deepin Boot Maker:告别命令行,3分钟制作Linux启动盘的智能解决方案
  • Plain Craft Launcher 2:重新定义你的Minecraft游戏体验

月新闻

  • 2026年6月公司网站搭建最新热门渠道测评:四大低成本/零代码平台对比+避坑
  • 【Linux】Linux arm 编译QT程序,出现expected “}“报错
  • 【MATLAB例程】四基站二维AOA定位与距离辅助增强对比仿真。基于角度观测和测距修正的固定目标平面定位精度分析

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号