当前位置: 首页 > news >正文

Build 2026:Azure API Management 推出统一模型 API 并新增 MCP 内容安全能力

微软在 Build 2026 开发者大会上宣布,将全面增强 Azure API Management 的 AI 网关能力。本次主要新增能力如下:一是推出统一模型 API(Unified Model API),客户端仅需使用一种 API 格式,Azure API Management 即可自动将请求适配为各类后端服务商对应的格式;二是 AI 网关现已支持接入 Anthropic 和 Google Vertex AI 旗下模型;三是内容安全策略升级,防护范围拓展至 MCP 工具调用以及智能体间(A2A)通信,与原有大语言模型流量一并纳入保护。
相较于为智能体单独搭建专属治理平台,Azure API Management 可帮助企业将成熟的 API 治理规则直接沿用至新兴的智能体生态体系中。
统一模型 API 现已进入公开预览阶段,解决了企业团队日益突出的运营痛点——随着团队越来越多地混合使用 OpenAI、Anthropic、Google 等提供商的模型(基于性能、成本、延迟或区域需求方面的考虑),每个提供商暴露的 API 格式各不相同。统一模型 API 让客户端可以统一采用一种格式(目前为 OpenAI Chat Completions),APIM 会透明地将请求转换为后端提供商的原生格式,无论是 Anthropic Messages API 还是其他模式。团队可以更换后端提供商、添加新模型或在不同提供商之间路由流量,都无需修改客户端代码。
这不仅仅是一个简单的功能适配层。将模型访问统一接入单一 API 接口后,无论由哪家服务商执行推理,所有治理策略、限流规则、内容安全检测与令牌用量统计都可统一生效。已经使用 APIM 进行传统 API 治理的组织可以将相同的模式延伸至 AI 工作负载,无需额外引入独立的治理体系。
内容安全能力向 MCP 与 A2A 场景延伸是本次架构层的 llm-content-safety 策略原本用于对照 Azure Content Safety 扫描 LLM 请求和响应内容,现在已同步覆盖 MCP 工具调用参数、MCP 响应文本以及 A2A 智能体交互载荷。同时,该策略包含两层独立安全防护:分类内容过滤,针对仇恨、自残、色情、暴力四类内容进行管控,支持设置风险等级阈值,范围为 0(最严格)至 7(最宽松);独立的 shield-prompt 属性,用于识别对抗性提示词注入攻击。典型配置示例如下:<llm-content-safety backend-id="content-safety-backend" shield-prompt="true" enforce-on-completions="true">
<categories output-type="EightSeverityLevels">
<category name="Hate" threshold="4" />
<category name="Violence" threshold="4" />
</categories>
</llm-content-safety>
团队需要注意的一个实现细节,即该策略在流式响应中的行为有所不同。在非流式模式下,一旦检测到违规内容,系统会直接返回 403 状态码。在流式模式下,策略会在滑动窗口中缓冲事件,并直接停止向客户端转发后续事件,且不会返回错误信息。因此,使用流式补全能力的智能体需适配这种内容中断的情况,不能依赖错误码做判断。两个新增的属性 window-size 和 window-overlap-size 可用于调整超长内容的拆分规则,适配 Azure 内容安全服务 10000 字符的评估上限。
词元统计指标已进行了升级,适配多提供商的使用场景。APIM 现在会将推理词元、缓存词元和音频词元记录到 Application Insights,支持 OpenAI Chat Completions、OpenAI Responses 和 Anthropic Messages API 等格式,可监控 Microsoft Foundry、OpenAI、Amazon Bedrock、Google Vertex AI 等多加服务商。对于需要构建成本仪表盘和预算警报的 FinOps 团队来说,扩展后的指标能够反映当前模型的实际行为——推理和缓存消耗了大量早期指标未能捕捉的词元预算。
在资源发现方面,Azure API Center 数据平面 MCP 服务器已正式发布(GA)。它可作为企业统一的资源发现端点:智能体和开发者工具可以通过单个 MCP 连接访问已注册的 MCP 服务器、工具、API、智能体及各类 AI 资产。当团队在 API Center 注册新的 MCP 服务器时,所有已连接的智能体都能自动发现它,无需逐个客户端重新配置。
APIM 现在还支持将已有的 REST API 暴露为 MCP 服务器,这意味着早于智能体时代的企业 API 无需重构即可被智能体调用。结合本次在 Build 大会上正式发布的 Logic Apps MCP 服务器,微软正在构建两条并行路径,帮助企业对接智能体:一条通过 API 网关层(APIM),另一条通过集成平台层(Logic Apps)。
对于正在评估 AI 网关方案的团队来说,www.ntjrcw.com行业竞争态势具有重要参考意义。亚马逊云科技的 Bedrock Guardrails 用于内容过滤和模型访问控制,但暂无产品可对标 APIM 的多厂商统一模型 API,以及针对 MCP、A2A 的全维度内容安全能力。谷歌的 Apigee 已添加一些 AI 网关功能,但尚未达到 APIM 现在覆盖的协议广度。Cloudflare 的 AI Gateway 侧重成本管控与缓存能力,而非多协议治理。APIM 的核心思路是:API 网关(而非全新品类产品)才是承载 AI 工作负载的天然控制平面。

AI 网关能力在所有 APIM 层级中均可用。统一模型 API 处于公开预览阶段。针对 MCP、A2A 的内容安全功能、升级后的词元指标以及 API Center MCP 服务器已正式发布(GA)。AI Gateway 实验室提供 30 多个实操 Jupyter Notebook,包含分步说明和可部署的 Bicep 模板。

http://www.rkmt.cn/news/1512253.html

相关文章:

  • 颠覆传统游戏管理:Snap Hutao如何重塑你的原神体验
  • 深入解析MPC5668G/E汽车MCU:Power架构、双核设计及车载网络实战
  • 2026年东北防静电地板市场态势:辽宁锦峰装饰材料有限公司的工艺壁垒与价值解析 - 企业推荐官【官方】
  • 5步掌握GetQzonehistory:QQ空间数据备份的终极实战指南
  • i.MX535嵌入式处理器深度解析:从Cortex-A8架构到多媒体加速实战
  • OpenSSL 4.0.1发布:修复多个高危CVE漏洞,保障系统安全!
  • 济宁黄金回收避坑干货|正规回收4大标准一看就懂 - 余生黄金回收
  • 2026 厦门包包正规回收:中检鉴定,透明报价 - 奢侈品回收评测
  • 2026年6月最新评测丨三亚目的地婚礼品牌排行更新洗牌!浅山四项突出 - 天天生活分享日志
  • 2026年 东北600*600防静电地板供应厂家:稳定抗静电、精密机房与数据中心首选品牌解析 - 企业推荐官【官方】
  • 济南闲置黄金变现指南 2026正规回收店全解析 - 余生黄金回收
  • 2026太原除甲醛避坑全指南:供暖季甲醛治理与陷阱揭秘 - 环保除醛知识库
  • TikTok新账号真正需要积累的是什么
  • 2026甄选:东北机房防静电地板厂家锦峰装饰材料专业防潮抗冻与施工服务深度解析 - 企业推荐官【官方】
  • 2026年小型气流粉碎机哪家质量好?专业生产厂家实力对比指南 - 品牌推荐大师
  • 平台会员里有哪些是可以真正免费领取实物或体验的?美团会员免费实物体验领取指南 - 资讯焦点
  • 如何在PC上免费畅玩Switch游戏:yuzu模拟器完整指南
  • ARM9嵌入式SoC设计精髓:从MC9328MXL看多媒体与低功耗系统优化
  • Android视频压缩终极方案:VideoCompressor完整使用指南
  • 终极FFXIV导航革命:Splatoon插件完整入门指南
  • 如何高效实现HTML到Word文档转换:专业工具的完整实战指南
  • Unity Editor免登录启动 无需UnityHub
  • R-Shell开源项目实战解析:用Rust打造命令行SSH工具,支持连接管理、远程执行、SFTP与MCP
  • APA第7版格式终极指南:让Microsoft Word参考文献一键规范
  • 5分钟快速上手go-redis/cache:构建你的第一个Go缓存应用
  • 2026人才盘点系统差异对比:北森、肯耐珂萨、Moka与问卷帮怎么选 - 资讯焦点
  • 高效解决WaveTools抽卡记录异常:完整排查与修复指南
  • Doris概述介绍
  • OneDrive卸载技术解析:Windows系统深度清理指南
  • NocoDB深度解析:企业级开源Airtable替代方案的技术架构与最佳实践