尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

【阿里拥抱开源】Qwen Image团队开源图像分解模型——Qwen-Image-Layered

【阿里拥抱开源】Qwen Image团队开源图像分解模型——Qwen-Image-Layered
📅 发布时间:2026/6/20 23:38:28

简介

我们很高兴推出Qwen-Image-Layered模型,该模型能够将图像分解为多个RGBA图层。这种分层表示解锁了内在可编辑性:每个图层可以独立操作而不影响其他内容。同时,这种分层表示天然支持高保真基础操作——例如调整大小、重新定位和重新着色。通过将语义或结构组件物理隔离到不同图层中,我们的方法实现了高保真且一致的编辑。

快速开始

  1. 确保您的transformers版本≥4.51.3(支持Qwen2.5-VL)
  2. 安装最新版diffusers
pip install git+https://github.com/huggingface/diffusers pip install python-pptx
fromdiffusersimportQwenImageLayeredPipelineimporttorchfromPILimportImage pipeline=QwenImageLayeredPipeline.from_pretrained("Qwen/Qwen-Image-Layered")pipeline=pipeline.to("cuda",torch.bfloat16)pipeline.set_progress_bar_config(disable=None)image=Image.open("asserts/test_images/1.png").convert("RGBA")inputs={"image":image,"generator":torch.Generator(device='cuda').manual_seed(777),"true_cfg_scale":4.0,"negative_prompt":" ","num_inference_steps":50,"num_images_per_prompt":1,"layers":4,"resolution":640,# Using different bucket (640, 1024) to determine the resolution. For this version, 640 is recommended"cfg_normalize":True,# Whether enable cfg normalization."use_en_prompt":True,# Automatic caption language if user does not provide caption}withtorch.inference_mode():output=pipeline(**inputs)output_image=output.images[0]fori,imageinenumerate(output_image):image.save(f"{i}.png")

案例展示

应用中的分层解构

给定一张图像,Qwen-Image-Layered可将其分解为多个RGBA图层:

分解后,编辑操作仅作用于目标图层,使其在物理层面与其他内容隔离,从而从根本上确保编辑的一致性。

例如,我们可以单独对首层重新着色,同时保持其他所有内容不受影响:

我们也可以将第二层从女孩替换为男孩(目标层使用Qwen-Image-Edit进行编辑):

我们将文本修改为“Qwen-Image”(目标图层使用Qwen-Image-Edit进行编辑):

此外,分层结构天然支持基础操作。例如,我们可以彻底删除不需要的对象。

我们也可以在不失真的情况下调整对象大小:

分层解构后,我们可以在画布上自由移动对象:

灵活可迭代的分层

Qwen-Image-Layered 不局限于固定分层数量。该模型支持可变层数分解,例如根据需求可将图像分解为3层或8层:

此外,分解可以递归应用:任何层级本身都可以进一步分解,从而实现无限分解。

许可协议

Qwen-Image-Layered 采用 Apache 2.0 许可证授权。

引用说明

如果您认为我们的工作对您有所帮助,我们诚挚地建议您引用相关成果。

@misc{yin2025qwenimagelayered, title={Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition}, author={Shengming Yin, Zekai Zhang, Zecheng Tang, Kaiyuan Gao, Xiao Xu, Kun Yan, Jiahao Li, Yilei Chen, Yuxiang Chen, Heung-Yeung Shum, Lionel M. Ni, Jingren Zhou, Junyang Lin, Chenfei Wu}, year={2025}, eprint={2512.15603}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2512.15603}, }

相关新闻

  • 跨境电商供应链协同:从复杂到可控的系统工具指南
  • 2025 年 12 月破碎站厂家权威推荐榜:移动/履带式/重型卡车式等全系列硬核装备实力解析与选购指南 - 品牌企业推荐师(官方)
  • LangFlow实时预览功能揭秘:即时调试LangChain应用不再是难题

最新新闻

  • 嵌入式GUI开发:emWin位图转换器优化实战与资源管理策略
  • embedding选错召回全废:嵌入模型怎么选
  • 如何快速实现智能音频转文字:Faster-Whisper-GUI 终极指南 [特殊字符]
  • 终极隐身指南:3分钟学会在英雄联盟和无畏契约中完美隐身,重新掌控你的游戏社交
  • 2026哈尔滨防水补漏避坑指南:卫生间/厨房/阳台/屋顶/地下室漏水检测维修全攻略,正规施工+透明报价+口碑榜靠谱服务商推荐 - 安佳防水
  • d2s-editor:如何用Web技术重塑暗黑破坏神2存档编辑体验?

日新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号