当前位置: 首页 > news >正文

GPT-5.5 和 Codex 正式登陆 Bedrock:接入全流程 + Codex 配置实战

GPT-5.5 和 Codex 正式登陆 Bedrock:接入全流程 + Codex 配置实战

OpenAI 的模型终于能在亚马逊云科技上跑了。

6 月 1 日,GPT-5.5、GPT-5.4 和 Codex 正式在 Amazon Bedrock 上线(GA),不是 Preview,直接可以用于生产。对于已经在用 Bedrock 的团队来说,这意味着不需要再单独维护一套 OpenAI 的 API Key 管理、计费对账、数据合规流程——直接走 Bedrock 统一入口,用量还能抵扣 AWS 承诺消费。

为什么这事值得关注

之前用 OpenAI 模型有几个痛点:

  1. API Key 散落各处 —— 每个项目组自己申请、自己管 key,安全团队管不过来
  2. 计费不透明 —— OpenAI 账单和 AWS 账单是两套,做 FinOps 归因很麻烦
  3. 数据合规顾虑 —— 数据送去 OpenAI 服务器,和你选的 AWS Region 没关系
  4. 无法复用现有治理 —— IAM 策略、VPC 端点、CloudTrail 审计这些全用不上

现在这些问题一次性解决了:

  • 推理在你选择的 Bedrock Region 内完成
  • 用 IAM 做权限控制
  • CloudTrail 记录每一次调用
  • 账单直接进 AWS Cost Explorer
  • 用量算入现有 AWS 承诺消费(EDP/PPA)

能用哪些模型

模型 Model ID 特点
GPT-5.5 openai.gpt-5.5 顶配,agentic coding + 复杂推理
GPT-5.4 openai.gpt-5.4 性价比,日常任务够用
GPT-OSS-120B openai.gpt-oss-120b 开源大模型
GPT-OSS-20B openai.gpt-oss-20b 轻量开源
Codex 通过 Codex App/CLI AI 编码 agent

定价和 OpenAI 官方一致,按 token 计费,没有 seat license。

快速接入:Python 调用 GPT-5.5

1. 获取 Bedrock API Key

在 Bedrock 控制台生成 API Key(这是新推出的认证方式,简化了 SDK 集成)。

2. 安装 OpenAI SDK

pip install -U openai

对,你没看错——用的是 OpenAI 官方 SDK,只是把 base_url 指向 Bedrock 的端点。

3. 设置环境变量

export OPENAI_BASE_URL="https://bedrock-mantle.us-east-2.api.aws/openai/v1"
export OPENAI_API_KEY="<你的 Bedrock API Key>"
export BEDROCK_OPENAI_MODEL_ID="openai.gpt-5.5"

4. 调用代码

import os
from openai import OpenAIclient = OpenAI(base_url=os.environ["OPENAI_BASE_URL"],api_key=os.environ["OPENAI_API_KEY"],
)response = client.responses.create(model=os.environ["BEDROCK_OPENAI_MODEL_ID"],input=[{"role": "developer","content": "你是一个 AWS 架构师,回答简洁实用。",},{"role": "user","content": "设计一个支持 10 万 QPS 的多区域架构方案",},],reasoning={"effort": "medium"},text={"verbosity": "low"},
)print(response.output_text)

几个注意点:

  • 用的是 responses.create(Responses API),不是老版的 chat.completions.create
  • reasoning 参数控制推理深度:low/medium/high
  • role: "developer" 对应以前的 system prompt

5. curl 也能直接调

curl "$OPENAI_BASE_URL/responses" \-H "Content-Type: application/json" \-H "Authorization: Bearer $OPENAI_API_KEY" \-d '{"model": "openai.gpt-5.5","input": [{"role": "developer", "content": "你是一个 AWS 架构师。"},{"role": "user", "content": "Lambda 冷启动怎么优化?"}],"reasoning": {"effort": "low"},"text": {"verbosity": "low"}}'

Codex 配置:让 AI 编码 agent 走 Bedrock 推理

Codex 是 OpenAI 的代码 agent——每周有 400 多万开发者在用。现在可以配置 Codex 把推理请求发到 Bedrock,数据不出你的 AWS 区域。

支持的客户端

  • Codex App(桌面端)
  • Codex CLI(命令行)
  • VS Code 扩展
  • JetBrains 插件
  • Xcode 集成

配置步骤

方式一:Bedrock API Key(推荐,简单)

# 设置环境变量
export AWS_BEARER_TOKEN_BEDROCK="<你的 Bedrock API Key>"

然后编辑 ~/.codex/config.toml

model = "openai.gpt-5.5"
model_provider = "amazon-bedrock"[model_providers.amazon-bedrock.aws]
region = "us-east-2"

方式二:AWS SDK 凭证链(适合已有 IAM 配置的团队)

如果不设 AWS_BEARER_TOKEN_BEDROCK,Codex 会自动 fallback 到 AWS SDK 凭证链(环境变量 → profile → EC2 实例角色),和你用 boto3 的逻辑一样。

配置完重启 Codex App 或 VS Code 扩展即可生效。

实际使用感受

跑了几天下来的体感:

  1. 延迟:GPT-5.5 推理速度比较快(OpenAI 标注为 "fast"),首 token 响应 ~1 秒左右
  2. 兼容性:现有的 OpenAI SDK 代码几乎不用改,换个 base_url 就行
  3. Codex 体验:跑大型项目的重构任务很流畅,后台跑完推送结果
  4. 计费:直接在 Bedrock 的 Usage 面板看,和 Claude 的用量放一起

和直接用 OpenAI API 的区别

维度 直接 OpenAI Bedrock 上的 OpenAI
认证 OpenAI API Key IAM / Bedrock API Key
数据位置 OpenAI 选择的服务器 你选的 AWS Region 内
审计 CloudTrail 全量记录
计费 OpenAI 独立账单 AWS 统一账单
承诺消费 不算 算入 EDP/PPA
Guardrails 不能用 可以加 Bedrock Guardrails
网络隔离 公网 支持 VPC Endpoint

适合什么团队

建议迁移过来的:

  • 已有 AWS 承诺消费的企业(用量能抵扣)
  • 对数据驻留有合规要求的行业(金融、医疗、政府)
  • 多模型混用的团队(Claude + GPT 同一入口管理)
  • 安全团队要求统一审计的组织

可以暂时不动的:

  • 个人开发者、小项目(OpenAI 直连更简单)
  • 只用 GPT 不用 AWS 其他服务的纯 AI 应用

踩坑备忘

  1. Responses API 是必须的 —— Bedrock 上的 OpenAI 模型走 Responses API,不支持老版 Chat Completions API。如果代码里还在用 chat.completions.create,需要迁移
  2. 模型名不要带版本号 —— 用 openai.gpt-5.5 不是 gpt-5.5-2026xxxx
  3. 区域选择 —— 目前不是所有区域都支持,建议用 us-east-2。具体看官方区域兼容性文档
  4. Codex 桌面端环境变量 —— 放 ~/.codex/.env 里,不是系统环境变量

总结

GPT-5.5 上 Bedrock 对企业用户来说是个好消息——终于不用在"想用 OpenAI 模型"和"数据合规 + 统一治理"之间做选择了。Codex 的 Bedrock 集成也很丝滑,改个配置文件就搞定。

如果你团队已经在用 Bedrock 跑 Claude,加个 GPT-5.5 就是改一行 model ID 的事。试试 Responses API,体验下新的调用方式。

官方资源:

  • 入门博客:https://aws.amazon.com/blogs/aws/get-started-with-openai-gpt-5-5-gpt-5-4-models-and-codex-on-amazon-bedrock
  • 区域兼容性:https://docs.aws.amazon.com/bedrock/latest/userguide/models-region-compatibility.html
  • Codex + Bedrock 配置:https://docs.aws.amazon.com/bedrock/latest/userguide/model-cards-openai.html
http://www.rkmt.cn/news/1530809.html

相关文章:

  • 2026亚洲主流EMBA客观测评:按需理性择校指南 - 品牌2026推荐
  • 渔人的直感:FF14钓鱼计时器终极配置指南
  • Linux 网络接口配置命令完整使用指南
  • Axios 0.21 vs 1.2:你的POST请求为啥突然变FormData了?手把手排查与修复
  • 别再只盯着能耗了!2023顶会SNN论文揭示的三大新趋势:动态结构、联合训练与脉冲Transformer
  • 2026年6月枣庄口碑好的无损漏水精准定位机构靠谱推荐榜,暗管/消防/地暖/外墙/屋顶漏水检测服务商选型指南 - 资讯热点
  • 3步彻底解决macOS应用卸载残留问题:Pearcleaner如何释放30%磁盘空间
  • 【Zephyr开发系列-7】Zephyr程序调试解析
  • VLE指令集:嵌入式处理器代码密度优化原理与应用
  • 2026谷歌流量转化操盘手测评榜单|中立选型指南(去营销化) - 品牌2026推荐
  • Prompt工程从入门到进阶!基于通义千问实战零样本/少样本/CoT/攻防防范(附完整代码)
  • 上海本地包包回收门店推荐:5家高评分机构实测,收的顶凭实力居首位 - 奢侈品回收测评
  • 2026短信营销降投诉方案:手机号黑名单检测技术选型推荐与落地指南
  • 71
  • 企业微信Java集成终极指南:wecom-sdk 3分钟快速对接实战
  • 金融方向发展,选应用统计还是大数据管理
  • 什么是JDK以及JDK都由哪些部分组成呢
  • 2026年粉末灌装机品牌选型指南:实力企业解析与采购参考 - 信息热点
  • OSPF区域内路由计算原理与LSA结构分析
  • 2026年AI论文软件全景评测:这5款工具如何重塑学术生产力
  • 题解:洛谷 P2709 【模板】莫队 / 小 B 的询问
  • MPC866外部总线接口:突发传输、总线仲裁与内存保留机制详解
  • 2026年商标购买平台排名+选购指南:从合规备案到流程过户,哪个最靠谱? - 信息热点
  • 敏感肌、学生党舒缓面膜怎么选?2026年修护面膜选购指南:温和维稳 晒后泛红全适配 - 17329971652
  • 口碑爆棚!长沙这些全屋定制风格,究竟藏着怎样的魅力? - 资讯速览
  • 哈尔滨各区名表回收测评,道里道外哪家出价更高 - 奢侈品回收测评
  • 抖音批量下载工具终极指南:从单视频到主页全量快速下载
  • 苹果降价终极低价确认官宣!6月16日晚8点苹果全机型全系大降价!iPhone17跳水至4000+,国补+618优惠券,买手机时机不要错过 - 资讯报道
  • FanControl终极指南:如何让Windows电脑风扇告别噪音困扰?
  • 7步掌握:HoRNDIS在macOS上实现Android USB网络共享的专业指南