当前位置: 首页 > news >正文

OpenAI 急了?GPT Image 1.5 强行发布,实测惨遭「大香蕉」吊打

OpenAI 急了。

上周刚发布GPT-5.2,这周就来了图像模型。

几小时前,OpenAI 发布了GPT Image 1.5GPT Image 1的升级版。

借用官方的说法,新模型速度提升 4 倍,编辑更精准,API 价格还降了 20%。

但是,先别高兴太早。

从新模型的命名就能看出,它大概率还是个过渡模型。

如果真的提升很大,那何不直接叫GPT Image 2

谷歌从小香蕉(Nano Banana)到大香蕉,那可是直接升级成了Nano Banana Pro

而我后面的实测也证实了这个推测。


01|更新了什么?

核心改进:「精准编辑」。

你让它改哪里,它就改哪里,其他地方保持不变。

这是之前 AI 编辑图片最头疼的问题。

GPT Image 1.5号称解决了它。

光线、构图、人脸特征,都能在多轮编辑中保持一致。

速度也快了不少。

官方说是 4 倍。

实测确实如此,主要是那个旧版模型太慢了,动不动就 1 分钟才画出来。

文字渲染也有明显进步。

GPT Image 1的文字能力只能说是一般。

今天的GPT Image 1.5好了不少。

来自 OpenAI 官方的一个案例。

让模型生成一份报纸版式,里面是完整的 Markdown 表格和多段落文章。

字是清晰可读的。


02|怎么用这个新模型?

打开 ChatGPT,现在侧边栏多了一个「Images」入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

产品力这一块,OpenAI 没得说。

模型已经在全量推送,免费用户也能用。

不需要切换,系统默认就是GPT Image 1.5


03|和大香蕉比怎么样?

这是你们最关心的问题。

GPT Image 1.5Nano Banana Pro,到底谁更强?

先说结论:Nano Banana Pro,YYDS。

尤其是中文文字渲染,差距明显。

但 OpenAI 这次在精准编辑和指令遵循上确实追上来了。

文字渲染也还可以,仅限英文。

来实测。

A seamless, high-definition editorial quote card. Subject: A hyper-realistic portrait of {argument name="author" default="Steve Jobs"} on the left. The image is rendered in flawless native 4k resolution, with razor-sharp focus on the eyes and facial textures. His figure and black turtleneck smoothly fade into the dark brown background using a soft gradient. Atmosphere: Sophisticated deep espresso brown texture, warm premium lighting. Text Layout: On the open negative space to the right, display the quote "{argument name="famous_quote" default="Stay Hungry, Stay Foolish"}" in an elegant Light-Gold Serif font. Place the signature "—{argument name="author" default="Steve Jobs"}" below it. Decor: A single, massive, semi-transparent opening quotation mark ( “ ) is placed artistically in the background behind the text. It has low opacity, appearing as a subtle watermark that blends into the brown background.

GPT Image 1.5生成的效果如下。

整体还不错,背景质感挺好。

作为对比,这是我之前用 Lovart 里的Nano Banana Pro生成的。

接下来测试编辑能力。

把图中的 “Stay Hungry, Stay Foolish” 改成“求知若饥,虚心若愚”。

差距这就来了。

GPT Image 1.5的指令遵循没有太大问题。

但中文文字的渲染,一塌糊涂。

除了前面 3 个字,后面全是乱码。

Nano Banana Pro的结果。

继续。

把乔帮主的头偏移一个合适的角度,不需要正对。

GPT Image 1.5画的,只能说,略显僵硬。

来看Nano Banana Pro的。

你更喜欢哪个?


04|年底大战

最近是 AI 圈的密集发布期,堪比过年。

谷歌率先推出Gemini 3 ProNano Banana Pro

OpenAI 立即反击,发布GPT-5.2GPT Image 1.5

Anthropic 也没闲着,据说圣诞节前会推出Claude Sonnet 4.7

另外,本周应该还有个小惊喜,谷歌的Gemini 3 Flash

代言人 Logan Kilpatrick 昨天已经开始预热:⚡️⚡️⚡️。

期待一波。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

http://www.rkmt.cn/news/113890.html

相关文章:

  • EmotiVoice语音合成在语音导航系统中的情感提示设计
  • 18、WRT54G路由器的硬件改造与故障修复指南
  • 80、由于没有提供第80章的具体英文内容,我无法为你完成博客创作,请你提供英文内容,以便我按照要求输出博客。
  • 1、Linksys WRT54G路由器:功能、历史与选购指南
  • 企业级语音系统搭建首选:EmotiVoice高可用架构设计
  • 45、Unix 文件系统:属性与权限深度解析
  • 22、Git 合并分支与拉取操作详解
  • 23、Git操作与日志查看全解析
  • 46、Unix 文件系统深入剖析:属性、链接与时间戳
  • 47、Unix系统文件管理与命令使用全解析
  • EmotiVoice语音风格迁移技术实践:跨语种情感复现
  • 18、Git远程协作全解析
  • 15、Git分支合并全解析:从基础操作到冲突处理
  • EmotiVoice能否用于生成冥想引导语音?用户体验调研
  • 17、构建前面板界面全解析
  • 16、Git 分支合并与克隆操作全解析
  • `@subcommand.command` 深度解析:从装饰器到命令行艺术的探索之旅
  • 18、嵌入式设备界面设计与视频内存管理
  • 17、深入理解Git仓库克隆与操作
  • 33、SNMP与帧缓冲设备驱动全解析
  • 29、Bash管理:命令行选项、环境定制与安全特性
  • 22、命令行处理:引用、内置命令与 eval 的高级运用
  • 13、文件与包操作指南
  • 7、Puppet基础设施搭建与配置指南
  • 6、Kubernetes 存储卷使用全解析
  • 5、Kubernetes 复制控制器与服务使用指南
  • EmotiVoice在教育领域的创新应用案例分享
  • EmotiVoice模型文件结构解析:理解其内部组成
  • 1、构建属于自己的 Kubernetes 集群
  • 基于微信小程序的在线婚礼策划系统毕业设计