尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

Solon AI 开发学习8 - chat - Vision(理解)图片、声音、视频

Solon AI 开发学习8 - chat - Vision(理解)图片、声音、视频
📅 发布时间:2026/6/18 0:29:05
本文介绍了大模型对多媒体内容的理解能力,包括图像、音频和视频三种类型。针对每种媒体类型,提供了相应的接口使用方法:Image接口支持URL、Base64字符串或字节数组创建图片;Audio和Video接口支持通过URL创建音频和视频。示例代码展示了如何将多媒体内容与提示语一起提交给大模型进行处理,实现内容识别和理解功能。这种能力扩展了大模型在多媒体分析领域的应用场景。

理解(或感知)多媒体内容的能力,需要大模型支持

1、理解图片(图像)

就是把图片和提示语一起提交给大模型。需要用到 Image 接口

接口 描述
Image.ofUrl(String) 根据 url 创建 Image
Image.ofBase64(String) 根据 base64 String 创建 Image
Image.ofBase64(byte[]) 根据 base64 byte[] 创建 Image

示例(有些模型需要提交 url ,有些需要提交 b64。按模型要求使用):

chatModel.prompt(ChatMessage.ofUser("这个图上有人像吗?", Image.ofUrl("http://.../demo.jpg"))).call();

2、理解声音(音频)

就是把声音和提示语一起提交给大模型。需要用到 Audio 接口

接口 描述
Audio.ofUrl(String) 根据 url 创建 Audio

示例:

chatModel.prompt(ChatMessage.ofUser("这里讲了什么?", Audio.ofUrl("http://.../demo.jpg"))).call();

3、理解视频

就是把视频和提示语一起提交给大模型。需要用到 Video 接口

接口 描述
Video.ofUrl(String) 根据 url 创建 Video

示例:

chatModel.prompt(ChatMessage.ofUser("这里讲了什么?", Video.ofUrl("http://.../demo.jpg"))).call();

相关新闻

  • Python全栈项目:基于Django的电子商务平台编写
  • 【触想智能】工业触控一体机在工业应用中扮演的角色以及其应用场景分析
  • 租房买房必看4门口乱堆杂物,正在悄悄“截断”全家人的好运气!

最新新闻

  • Gitea容器镜像仓库未授权访问漏洞CVE-2026-27771深度解析与修复指南
  • MCP342x高精度ADC芯片I2C通信配置与多器件应用实战
  • 北京评价高的专业字画回收机构:排名2026 - 品牌排行榜
  • 2026福田区搬家公司Top5榜单:服务范围全街道,适配本地人强推正规搬运公司 - 从来都是英雄出少年
  • 联邦学习如何重构心理App的临床可信度
  • 5步实战OpenCore Legacy Patcher:让老旧Mac焕发新生的完整指南

日新闻

  • 5分钟掌握Python进化算法:Geatpy高性能优化工具完全指南
  • Microchip 24AA044 EEPROM选型与应用全指南:从参数解析到实战编程
  • 华为的鸿蒙到底有多牛?为什么称作遥遥领先?

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号