**BGE(智源)** 与 **M3E(MokaAI)** 讲清楚:定位、版本、参数、用法、RAG 选型建议,直接可用。
**BGE(智源)** 与 **M3E(MokaAI)** 讲清楚:定位、版本、参数、用法、RAG 选型建议,直接可用。
一、BGE(BAAI General Embedding)
出品:北京智源研究院 BAAI,2023 年起,中文 RAG 最常用的强性能嵌入模型。
1)核心定位
- 强语义、强检索、多语言、长文本
- 适合:企业 RAG、知识库、长文档、跨语言场景
2)主流版本(选一个即可)
BGE v1.5(经典中文)
bge-large-zh-v1.5:335M,1024 维,512 token,中文最强,推理慢BGEbge-base-zh-v1.5:109M,768 维,512 token,平衡首选BGEbge-small-zh-v1.5:33M,512 维,512 token,速度快、精度略低BGE
BGE-M3(2024 全能版,推荐新系统用)
- 569M,1024 维,最长 8192 token
- 三大能力:
- 稠密 + 稀疏 + 多向量(长文档分块匹配)
- 100 + 语言,中英
