尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

【vLLM】使用vLLM部署Qwen3-VL-30B-A3B-Instruct

【vLLM】使用vLLM部署Qwen3-VL-30B-A3B-Instruct
📅 发布时间:2026/6/18 22:32:29
  • 环境与设备配置:H20*8(96G)
MODEL_ID=Qwen/Qwen3-VL-30B-A3B-Instruct
MODEL_NAME=Qwen3-VL-30B-A3B-Instruct
python3 -m vllm.entrypoints.openai.api_server \--model  $MODEL_ID \--served-model-name $MODEL_NAME \--tensor-parallel-size 8 \--mm-encoder-tp-mode data \--limit-mm-per-prompt.video 0 \--mm-processor-cache-type shm \--enable-expert-parallel \--host 0.0.0.0 \--port 22002 \--dtype bfloat16 \--gpu-memory-utilization 0.75 \--quantization fp8 \--distributed-executor-backend mp

请求推理

import time
from openai import OpenAIclient = OpenAI(api_key="EMPTY",#base_url="http://127.0.0.1:22002/v1",base_url="http://10.0.128.211:22002/v1",timeout=3600
)messages = [{"role": "user","content": [{"type": "image_url","image_url": {"url": "https://ofasys-multimodal-wlcb-3-toshanghai.oss-accelerate.aliyuncs.com/wpf272043/keepme/image/receipt.png"}},{"type": "text","text": "Describe the image."}]}
]start = time.time()
response = client.chat.completions.create(#model="Qwen3-VL-235B-A22B-Thinking",#model="Qwen3-30B-A3B-Instruct-2507",#model="/mnt/data/projects/GLM_4.5v/ckpts/Qwen/Qwen3-30B-A3B-Instruct-2507",model="Qwen3-VL-30B-A3B-Instruct",messages=messages,max_tokens=2048
)
print(f"Response costs: {time.time() - start:.2f}s")
print(f"Generated text: {response.choices[0].message.content}")
Talk is cheap. Show me the code

相关新闻

  • 2025通风气楼厂家推荐:欧诺通风设备,高效节能品质之选
  • 2025年湖南短视频代运营/拍摄/剪辑/方案策划/推广/引流/IP打造公司综合实力排行榜推荐
  • 2025.10.11NOIP模拟

最新新闻

  • 视觉具身智能:从多模态模型到可执行AI工作流的范式升级
  • 微论-双圈向量,是否为RAG的换命术?
  • 终极免费!用NoFences彻底告别Windows桌面混乱
  • 让经典游戏手柄重获新生:XOutput 输入协议转换指南
  • 如何通过频谱分析解决音频质量检测的三大难题
  • 免费的pdf转excel工具推荐?2026永久免费888PDF转换器PDF转Excel实测推荐 - 工具测试专家

日新闻

  • 2026年不锈钢卷板厂家推荐排行榜:冷轧热轧/304/201不锈钢卷板,高颜值耐腐蚀源头厂家实力精选 - 企业推荐官【官方】
  • FLUX.1-dev FP8模型实战指南:24GB以下显卡高效部署方案
  • 2026佛山长途搬家价目表:跨省跨市搬家费用完整计算指南 - 从来都是英雄出少年

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号