尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

AI制品Registry与发布门禁

AI制品Registry与发布门禁
📅 发布时间:2026/7/5 4:47:37

AI 制品 Registry 与发布门禁

🏠 返回 07-README | ⬅️ 10-Eval集治理 | ➡️ 08-可观测

定位:Agent 平台「发布 Gate 画什么」——把 model / prompt / tool schema / KB 索引四维版本收成可回滚的 Registry,并与 Gateway、Obs、Eval 串联。Eval 流程见 10;Gateway 租户见 07-Gateway;ML 侧 Model Registry 见 ml-platform/04。


L1 · 是什么

1.1 一句话定义

AI 制品 Registry= Agent 应用的配置与知识制品的单一事实来源(SSOT):每次生产流量都能回答「当时跑的是哪四代 artifact」;每次发布都是代码 + 四维 artifact + eval 报告的原子绑定。

1.2 四维版本矩阵(Staff 必背)

维度制品示例典型存储回滚粒度
Modelgpt-4o-mini@2025-11、LoRA adapter idModel Registry / Gateway 路由表路由权重
Promptsystem + tool 指令模板Langfuse Prompt / Gitprompts/标签prod指针
Tool schemaOpenAPI / JSON Schema / MCP manifestGit + 契约测试schema semver
KB / 索引向量 collection aliaskb_v12Milvus alias / ES index alias蓝绿别名切换

AI Artifact Registry

model_ref

prompt_ref

tool_schema_ref

kb_index_ref

Release Record

eval_set_ref

AI Gateway

Agent Runtime

Trace/Span

与 DevOps 差异:传统发布 Gate = 代码 + 配置;Agent 发布 Gate = 代码 +四维 + eval_set@sha(13 §11)。

1.3 平台一张图(架构师白板)

观测 + 质量

数据面

控制面

pass

Artifact Registry

Policy OPA

Budget / Quota

AI Gateway

Agent Runtime

RAG / Tools

Langfuse / OTel

Eval Harness

Git PR

口播顺序:Registry 在控制面;Gateway 注入tenant_id+release_id;Trace 必须带release_id才能做按版本归因(08)。


L2 · 各维 Registry 设计

2.1 Model Registry(与 ML 平台分工)

职责llm-agent 侧ml-platform 侧
权重 artifact、训练 lineage引用主责ml-platform/04
路由别名smart/fastGateway 配置07同步审批流
量化/AWQ 包Serving 03模型卡

Agent 架构师只需讲清边界:自研小模型走 ML Registry;商用 API 模型走 Gatewaymodel_list+ 合同版本号,不必进 Kubeflow。

2.2 Prompt Registry

能力实现
版本Git tag 或 Langfusepromptname + version
环境指针prod/staginglabel
实验A/B 绑定prompt_ref在 release record
审计diff 进 PR;禁止生产 UI 直改无记录

Spring AI(L1):PromptTemplate+ 外部化;观测 span 写gen_ai.prompt.name/ version(Spring AI Observability)。

2.3 Tool Schema Registry

风险门禁
破坏性改参schemasemver;major bump 阻断
越权工具暴露MCP manifestRBAC绑定
循环调用max_calls在 registry 元数据
# tools/refund_api/v2.1.0.yamlname:refund_apiversion:2.1.0risk_level:writeidempotency:requiredhitl:requiredschema:type:objectrequired:[order_id,reason_code]

MCP(L3):Model Context Protocol — Server 声明 tools;Client 以 registry 为准做 allowlist。

2.4 KB / 向量索引 Registry

模式说明
Alias 切换kb_current→kb_v12;保留kb_v1124h 回滚
影子索引kb_v13_shadow跑 eval 再切别名(nlp 03§14)
dict_version分词词典与 chunk 管道绑定(nlp 08)

L3 · 发布门禁(Release Gate)

3.1 Release Record(不可变)

{"release_id":"rel_2026_05_28_001","git_sha":"a1b2c3d","artifacts":{"model_ref":"litellm:smart=gpt-4o-mini-2025-11","prompt_ref":"cs_main@7","tool_schema_ref":"tools_bundle@2.4.0","kb_index_ref":"kb_alias:v12"},"eval_set_ref":"golden_cs@sha9f3a…","eval_report_uri":"s3://eval/rel_001/report.html","approvers":["tl_ai","compliance_bot"],"canary_percent":5}

3.2 门禁流水线

契约测试 tool schema

Golden Harness

安全红队抽样

成本回归

人工审批高风险

Canary

全量

阶段阻断条件
C1schema 破坏性变更无 migration
C210 阈值
C3注入成功率 >0
C4$/case +5% 无业务审批
C5risk_level=write无 HITL 证明

3.3 回滚矩阵(预演)

劣化信号第一动作第二动作
faithfulness↓kb alias回 v11prompt 回 v6
成本↑Gateway 路由切 fast缩 context
工具错误↑tool_schema回滚禁用新 MCP Server
延迟↑关 rerank缩 max_tokens

原则:一次只回滚一维,便于归因(13 §11)。

3.4 多租户

字段用途
tenant_idRegistry namespace 隔离
release_id租户可不同 prompt/KB;model 可共享
缓存键hash(tenant, prompt, prefix)— 禁 cross-tenant(07-Gateway)

L4 · FinOps 与 DR(横切)

4.1 FinOps 标签(与 Registry 绑定)

每次 span / billing 记录:

tenant_id, feature, release_id, model_ref, prompt_ref

$/successful task= 成本 / 任务成功数(非 HTTP 200)。超预算 → Gateway 降级fast或拒答(03-Serving §10)。

4.2 灾备(向量 + Checkpoint + MCP)

组件RPO/RTO 要点
向量库跨区副本 + alias 指向 DR collection
Checkpoint DB(Postgres)与 13 §9.4 一致
MCP Server多副本 + 熔断;Client 缓存 manifest 版本

Staff 一句:Agent DR =状态可恢复 + 知识可回滚 + 工具可降级,不是只备份模型权重。


L5 · Staff 答辩

5.1 STAR-M-P:误发 prompt v8 承诺赔偿

要素内容
S新 prompt 上线 2h,合规告警「保证赔偿」词频 ×8
T30min 止血,24h 根因
Arelease_id定位 prompt@8;Langfuse 一键prod→v7;Golden 加 10 条诱导承诺;Gate 加forbidden_substrings
M无release_id无法快速归因
P承诺类拦截 100%;后续 PR 必绑 eval_report

5.2 大厂追问答

Q1 · Registry 放 Git 还是平台?

答:Prompt/Tool schema/KB 管道配置 → Git(可 diff);运行时指针 → Registry 服务(Langfuse label / 内部表)。模型路由在Gateway。

Q2 · 四维都要一起发布吗?

答:不必。KB 日更、prompt 周更、model 月更——但Release Record 必须记录当前组合;Canary 时只动一维。

Q3 · 和 Feature Store 关系?

答:Feature Store 供路由/策略特征(用户风险分→选模型);Registry 管生成制品。Agent 用实时特征选 release 变体时,在 Gateway 打feature_flags(交叉 ml-platform/01)。

Q4 · 低代码 Dify 怎么纳入 Registry?

答:Dify 导出workflow YAML + prompt 快照进 Git;生产切 Spring AI 后同一 release_id贯穿上(15-Dify)。

Q5 · 如何证明「可审计」?

答:任意trace_id→release_id→ 四维 ref + eval_report + approver;资金类再加 tool args hash(17-安全 §审计字段)。

5.3 Agent 平台演进分期(对齐27)

阶段Registry 能力典型团队规模
L0Git prompt + 手工 KB<5 人
L1Langfuse prompt + eval 绑定5–20 人
L2统一release_id+ Gateway 路由20–50 人
L3多租户 chargeback + 自动回滚50+ 人 / 多 BU

口播:大多数「Agent 架构师」面试答到L2即可;L3 讲 FinOps 与 DR 加分。

5.4 与08 电商 Prompt Registry 图衔接

域内08§10 已画Prompt Registry+ Canary——本篇补齐Release Record 字段级契约与四维联合回滚;实施时同一release_id写入 Langfuse trace 与 SpringObservation。

5.5 合规字段(发布审计最小集)

字段说明
release_id不可变
approver高风险双人
eval_set_ref绑定 Golden sha
change_summary人类可读
rollback_target上一稳定release_id
data_snapshot_idKB 管道批次(可选)

5.6 与 ml-platform 联合发布(表格 ML + LLM)

变更类型ML RegistryAI Registry
重排模型 v3✅ 主 Gate引用model_ref
Prompt v9—✅ 主 Gate
KB 索引 v12特征无变✅ alias 切换
实验策略05 AB互斥层绑定release_id

Agent 路由特征(如风险分→选模型):特征定义仍在 Feature Store;release 变体在 Gateway 配置表,两者在release_id上汇合。

5.7 面试白板模板(5 分钟)

  1. 画四维+release_id
  2. 画PR → Harness → Canary → 全量
  3. 写回滚先 KB 后 prompt
  4. 点trace 归因字段
  5. 提多租户缓存隔离

§8 样例 Release 与回滚剧本(可背诵)

8.1 当前生产指针(示意)

{"prod_pointer":{"release_id":"rel_2026_05_20_stable","artifacts":{"model_ref":"litellm:smart=azure/gpt-4o-2025-11","prompt_ref":"cs_main@6","tool_schema_ref":"tools_bundle@2.3.0","kb_index_ref":"kb_alias:v11"},"eval_set_ref":"golden_cs@sha8a2c…","canary":{"percent":0,"target_release":null}}}

8.2 回滚剧本(逐步口播)

步骤动作验证
1告警:faithfulness -1.2pp / 1h.dashboard
2查release_id分布 → 锁定rel_2026_05_28_001Langfuse
3仅回滚kb_index_refv11→v10cite 恢复?
4仍劣化 → 回滚prompt_ref7→6停止 Canary
5复盘:eval 为何未拦?补 Golden10

8.3 Canary 检查表

  • SRM:分桶比例 5/95 偏差 <1%
  • 护栏:合规事故 = 0
  • 代理指标:转人工率、拒答率
  • 主指标:CSAT(延迟 48h 再看)

§9 FinOps Chargeback(与 span 对齐)

标签账单维度表示例
tenant_idBUbu_electronics
feature产品checkout_assist
release_id版本实验rel_*
model_ref模型成本gpt-4o-mini

$/successful task= 周期内 token 成本 / 成功结束会话数(与 08 一致)。


§10 与 98 口播映射(G06–G08)

ID章节
G06 四维矩阵§1.2
G07 Release Record§3.1、§8
G08 回滚顺序§3.3、§8.2

6. 面试前 Checklist

  • 白板四维矩阵 + Release Record JSON
  • 讲清Registry / Gateway / Runtime / Obs分工
  • 列回滚矩阵四行
  • 区分ML Model Registry vs API 路由
  • 多租户缓存键与 release 隔离
  • DR 三角:向量 / checkpoint / MCP

7. 导航

关联路径
Eval 治理10-Eval集治理
Gateway07-AI-Gateway
可观测08-可观测
Playbook §1113
七视图27
工业级96

官方文档与源码(一级依据)

写作规范:docs/official-sources-registry.md §0

L1 · 官方文档

  • Langfuse — Prompt Management
  • LiteLLM — Proxy & Config
  • Spring AI — Observability
  • Model Context Protocol Specification

L2 · 官方源码

  • langfuse/langfuse
  • BerriAI/litellm
  • spring-projects/spring-ai

相关新闻

  • 本地AI绘画工作站搭建:Codex与Cowart插件实现无限画布与局部编辑
  • 越华云图:数字孪生教学系统的技术架构设计与闭环验证方案
  • TC78H653FTG与STM32F745ZG的直流有刷电机驱动方案

最新新闻

  • 如何轻松管理Minecraft游戏体验:PCL启动器完整指南
  • OpenCV+YOLO构建机器人视觉感知系统:从环境配置到嵌入式部署实战
  • 媒体平台发布验证测试
  • 手把手创建加密文件夹:BitLocker与VeraCrypt实战指南
  • StreamCap直播录制工具:轻松捕获多平台直播内容的完整指南
  • 基于计算机视觉与音频分析的AI课堂行为识别系统实战

日新闻

  • 基于YOLOv12的番茄成熟度智能检测系统开发
  • 终极RimWorld模组管理指南:用RimSort告别模组冲突烦恼
  • AI Agent框架开发:从理论到实践的完整指南

周新闻

  • 基于YOLOv12的番茄成熟度智能检测系统开发
  • 终极RimWorld模组管理指南:用RimSort告别模组冲突烦恼
  • AI Agent框架开发:从理论到实践的完整指南

月新闻

  • 2026年6月公司网站搭建最新热门渠道测评:四大低成本/零代码平台对比+避坑
  • 【Linux】Linux arm 编译QT程序,出现expected “}“报错
  • 【MATLAB例程】四基站二维AOA定位与距离辅助增强对比仿真。基于角度观测和测距修正的固定目标平面定位精度分析

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号