尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

封装统一多模态客户端(整合文字对话 + 文生图 + 语音转写)

封装统一多模态客户端(整合文字对话 + 文生图 + 语音转写)
📅 发布时间:2026/7/2 2:33:18
import dashscope # 1. 修改导入:使用 MultiModalConversation 处理多模态对话 from dashscope import MultiModalConversation from dashscope.aigc.image_generation import ImageGeneration import os # 只保留api_key,删除手动base_http_api_url解决url 400报错 dashscope.api_key = os.getenv("DASHSCOPE_API_KEY") # 密钥前置校验 if not dashscope.api_key: raise RuntimeError("请配置环境变量 DASHSCOPE_API_KEY") class MultiModalClient: def __init__(self): self.llm_model = "qwen3.7-plus" self.img_model = "qwen-image-2.0-pro-2026-04-22" self.asr_model = "qwen3-asr-flash" def chat(self, prompt): """纯文本对话""" try: # 2. 修改调用方法:使用 MultiModalConversation.call 替代 Generation.call rsp = MultiModalConversation.call( model=self.llm_model, messages=[{"role": "user", "content": prompt}] ) if rsp.status_code == 200: return rsp.output.choices[0].message.content print(f"【对话失败】code:{rsp.status_code}, msg:{rsp.message}") return None except Exception as e: print(f"【对话异常】{str(e)}") return None def generate_image(self, prompt, size: str = "1024*1024"): """文生图:使用 messages 格式传参""" try: rsp = ImageGeneration.call( model=self.img_model, messages=[ { "role": "user", "content": [ {"text": prompt} ] } ], size=size, n=1 ) if rsp.status_code == 200: # 核心调试:直接打印完整的 output 对象,查看真实的字段结构 # print("【调试信息】文生图返回结构如下:") # print(rsp.output) # 尝试提取图片链接(请根据上面打印出的真实结构调整路径) # 如果报错,请把上面打印的内容发给我 # 可能的路径示例: # return rsp.output.choices[0].message.content[0]["image"] # return rsp.output.results[0].url return rsp.output.choices[0].message.content[0]["image"] return "请查看控制台打印的调试信息" print(f"【文生图失败】code:{rsp.status_code}, msg:{rsp.message}") return None except Exception as e: print(f"【文生图异常】{str(e)}") return None def speech2text(self, audio_path): """语音转文字:兼容新版返回结构+捕获异常""" try: rsp = dashscope.MultiModalConversation.call( model=self.asr_model, files=[{"file": audio_path}], messages=[{"role": "user", "content": [{"audio": audio_path}]}], result_format="message", asr_options={ "enable_itn": False } ) if rsp.status_code == 200: text_parts = [] for item in rsp.output.choices[0].message.content: if "text" in item: text_parts.append(item["text"]) return "".join(text_parts) print(f"【语音转写失败】code:{rsp.status_code}, msg:{rsp.message}") return None except Exception as e: print(f"【语音转写异常】{str(e)}") return None # 整体测试 if __name__ == "__main__": client = MultiModalClient() # 文本对话测试 chat_res = client.chat("你好") print("对话输出:", chat_res) # 文生图测试 img_url = client.generate_image("沙漠烈日仙人掌,治愈风景,写实高清") print("图片链接:", img_url) text = client.speech2text("录音.mp3") print("语音转文字:",text)
D:\program\bigmodel\.venv\Scripts\python.exe D:\program\bigmodel\week2\day12\升级:封装统一多模态客户端.py 对话输出: [{'text': '你好!有什么我可以帮你的吗?'}] 图片链接: https://dashscope-7c2c.oss-accelerate.aliyuncs.com/7d/a3/20260701/51613171/0c618569-2b02-48cb-b3c6-3f318915d0ad.png?Expires=1783515731&OSSAccessKeyId=LTAI5tPxpiCM2hjmWrFXrym1&Signature=29L0STjlteQU1rJ%2FkG9YAUkEf0U%3D 语音转文字: 喂喂喂,测试测试,一二三,一二三。 进程已结束,退出代码为 0

相关新闻

  • React 渲染性能:组件边界、状态下沉与重渲染治理
  • AI 辅助:独立开发者技术选型:最好的技术是能让产品活下去
  • 一文看懂 DDoS 与 CC 攻击:攻击类型全解析 + 完整防护方案

最新新闻

  • 2026 专业级宣传动画素材平台横评:5 大高品质站点画质与效率实测
  • 从“AI是什么”到“AI能为我做什么”:山东企业家必须搞懂的8个AI认知升级问题
  • 【课程设计/毕业设计】基于 Java 的医疗设备智能监管统计系统的设计与实现【附源码、数据库、万字文档】
  • 烘焙品牌策划设计公司怎么选?从视维的品牌实践看烘焙赛道突围
  • 抖音下载器完整指南:5分钟学会免费下载抖音视频和音乐
  • 数据库缓存一致性方案:阿里云 PolarDB 多级一致性架构详解

日新闻

  • Python Playwright录制功能:从零到一构建自动化测试脚本
  • 如何用开源工具永久保存你心爱的小说:novel-downloader全攻略
  • In-Context Learning不是教知识,而是模式对齐:从5个示例到100个工业级样本的真相

周新闻

  • Windows字体自定义终极方案:No!! MeiryoUI完全指南
  • Deepin Boot Maker:告别命令行,3分钟制作Linux启动盘的智能解决方案
  • Plain Craft Launcher 2:重新定义你的Minecraft游戏体验

月新闻

  • 2026年6月公司网站搭建最新热门渠道测评:四大低成本/零代码平台对比+避坑
  • 【Linux】Linux arm 编译QT程序,出现expected “}“报错
  • 【MATLAB例程】四基站二维AOA定位与距离辅助增强对比仿真。基于角度观测和测距修正的固定目标平面定位精度分析

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号