尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

【Z-Image-Turbo 量化模型】svdq-int4 / fp4 多版本对比与下载说明svdq-int4_r256-z-image-turbo.safetensors

【Z-Image-Turbo 量化模型】svdq-int4 / fp4 多版本对比与下载说明svdq-int4_r256-z-image-turbo.safetensors
📅 发布时间:2026/6/20 2:29:26

【Z-Image-Turbo Nunchaku 量化模型下载】svdq-int4 / fp4 多版本对比与下载说明 svdq-int4_r256-z-image-turbo.safetensors

关键词:Z-Image-Turbo、SVDQuant、INT4、FP4、Diffusion 模型量化、ICLR2025
最近在折腾文生图模型的推理性能优化时,接触到了Nunchaku 团队基于 Z-Image-Turbo 的 SVDQuant 量化版本,实际体验下来,对显存占用和推理速度的改善非常明显,这里做一次完整梳理和记录。

模型下载地址(网盘链接)

本文主要介绍以下五个常用模型文件 可通过网盘获取:

  • svdq-int4_r256-z-image-turbo.safetensors
  • svdq-int4_r128-z-image-turbo.safetensors
  • svdq-fp4_r128-z-image-turbo.safetensors
  • svdq-int4_r32-z-image-turbo.safetensors
  • svdq-fp4_r32-z-image-turbo.safetensors

👉网盘下载地址:
https://pan.quark.cn/s/472aeef09aa4?pwd=fCD2


一、模型背景说明

Z-Image-Turbo是 Tongyi-MAI 推出的高性能文生图模型,在生成质量和速度之间做了比较好的平衡。

而Nunchaku团队基于 ICLR 2025 的论文成果SVDQuant,对该模型进行了4bit 级别量化,在尽量不损失画质的前提下,大幅降低了显存和算力需求。


二、模型核心信息一览

base_model:Tongyi-MAI/Z-Image-Turbobase_model_relation:quantizeddatasets:-mit-han-lab/svdquant-datasetslibrary_name:diffuserspipeline_tag:text-to-imagelicense:apache-2.0language:-entags:-image-editing-SVDQuant-Z-Image-Turbo-Diffusion-Quantization-ICLR2025

三、项目与模型展示


四、模型说明(Model Card 摘要)

1️⃣ 基本介绍

  • 模型名称:nunchaku-z-image-turbo
  • 模型类型:Text-to-Image / Image Editing
  • 开发团队:Nunchaku Team
  • 原始模型:Tongyi-MAI / Z-Image-Turbo
  • 许可证:Apache-2.0

该仓库包含的是Nunchaku 优化后的 Z-Image-Turbo 量化模型版本,主打高效推理 + 低显存占用。


2️⃣ 量化方式说明(重点)

显卡类型数据类型
50 系列以下显卡INT4
50 系列(Blackwell)NVFP4

Rank(低秩分解维度)说明:

  • r32:速度最快,画质一般
  • r128:速度与质量平衡(推荐)
  • r256:质量最高,速度最慢

五、模型文件对照表

标准推理模型(通用)

数据类型Rank模型文件名
INT4r32svdq-int4_r32-z-image-turbo.safetensors
INT4r128svdq-int4_r128-z-image-turbo.safetensors
INT4r256svdq-int4_r256-z-image-turbo.safetensors
NVFP4r32svdq-fp4_r32-z-image-turbo.safetensors
NVFP4r128svdq-fp4_r128-z-image-turbo.safetensors

📌个人建议:

  • 显存 8G~12G:INT4 r128
  • 追求画质:INT4 r256
  • 50 系显卡:优先FP4 r128

六、使用方式说明

1️⃣ Diffusers 使用

官方示例代码在这里:

  • 示例脚本:
    https://github.com/nunchaku-tech/nunchaku/blob/main/examples/v1/z-image-turbo.py

  • 使用文档:
    https://nunchaku.tech/docs/nunchaku/usage/zimage.html


2️⃣ ComfyUI 工作流

  • 官方工作流 JSON:
    https://nunchaku.tech/docs/ComfyUI-nunchaku/workflows/zimage.html#nunchaku-z-image-turbo-json

对于习惯ComfyUI 可视化工作流的用户来说,几乎是即插即用。


七、性能表现参考

从官方测试图可以看到:

  • 4bit 量化后显存占用大幅下降
  • 推理速度在中低端显卡上提升明显
  • 对生成质量影响相对可控(尤其 r128 / r256)


九、参考与来源

  • 推理引擎:
    https://github.com/nunchaku-tech/nunchaku
  • 量化工具:
    https://github.com/nunchaku-tech/deepcompressor
  • 论文:
    https://arxiv.org/abs/2411.05007
  • 在线 Demo:
    https://demo.nunchaku.tech

十、写在最后

如果你正在做本地文生图部署、ComfyUI 工作流优化、低显存显卡推理,这套Z-Image-Turbo 的 SVDQuant 版本确实值得尝试。

相关新闻

  • YOLOFuse训练曲线解读:loss下降缓慢可能是这些原因
  • YOLOFuse真实来源验证:仅认准GitHub官方仓库链接
  • YOLOFuse软链接修复命令:解决python命令无法执行的问题

最新新闻

  • 2026襄阳2026正规漏水检测维修公司精选口碑榜TOP5权威推荐-精准定位检测漏水点-专业防水补漏堵漏维修、卫生间/厨房/屋顶/天沟/地下室/阳台防水漏水检测维修 - 安佳防水
  • 5步掌握FitGirl游戏启动器:高效管理压缩游戏的终极工具
  • 2026年西安评价高的玻璃门生产厂家哪家强 - 品牌鉴赏官2026
  • 江门报名 CPPM 注册采购经理哪家靠谱?机构选择避坑指南 - 众智商学院课程中心
  • 如何在OBS直播中添加实时语音识别字幕:免费开源插件终极指南
  • 如何快速掌握跨设备控制:终极多平台键鼠共享方案

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号