大模型有两个毛病:幻觉和时效性。
幻觉是指模型会一本正经地编造不存在的信息。你问它一个专业问题,它可能给出一个看起来很专业、实际完全错误的答案。时效性是指模型的训练数据有截止日期,之后发生的事它不知道。
这两个毛病在企业场景里是致命的。你让大模型回答客户的技术咨询,它编了一个不存在的参数,客户照着用出了问题,谁来负责?你让大模型查公司最新的制度文件,它拿两年前的版本回答你,合规风险谁担?
RAG是解决这两个毛病的标准方案。但RAG不是装上去就能用的,它依赖一个高质量的知识库。
鸿翼把RAG的落地拆成了几个关键环节。
首先是知识入库。鸿翼提供多种知识采集方式:在线编写、文档上传、海量API配置化采集。企业的知识来源繁杂,有的在OA系统、有的在ERP、有的在个人邮箱。API采集能力把这些散落各处的知识统一归集到知识库中。入库之后,基于流程实现高质量知识的审核和上架。不是什么内容都能进库,要有把关机制。
其次是知识结构化。这是RAG效果的决定性因素。文件进库后,鸿翼的多模态解析引擎对内容做深度处理。文档被智能分块,每个块附带元数据。图片做OCR识别,视频抽帧提取关键画面。分块策略直接影响RAG的召回质量,分得太粗检索不精准,分得太细丢失上下文。鸿翼支持解析深度等参数设置,企业可以根据场景灵活调整。
然后是向量化。结构化后的内容通过向量化服务转化为语义向量,存入向量数据库。用户提问时,问题也被向量化,系统在向量数据库中找到语义最相近的内容块。这一步决定了检索的准确率。鸿翼基于InWise大模型平台的向量化能力,针对企业内容做了优化。
接着是检索增强。检索到的内容块连同用户问题一起发给大模型。模型基于这些具体材料生成回答,而不是凭自己的记忆编。回答的每个观点都有知识库里的原文支撑,可追溯、可验证。幻觉问题大大缓解。
最后是持续迭代。企业知识在持续更新,知识库也需要同步更新。新文档入库后自动走解析、分块、向量化流程,RAG的检索范围实时扩展。模型不需要重新训练,知识库更新即可。
鸿翼的InWise平台和易慧大模型支持私有化部署。企业数据不出域,接入和微调全程可控。这对数据安全要求高的行业是硬性条件。
RAG的效果好不好,80%取决于知识库的质量。分块策略合不合理、元数据完不完整、向量化模型准不准、知识更新及不及时。这些功夫都在知识库层面,不在模型层面。大模型是引擎,知识库是燃料。燃料品质不行,再好的引擎也跑不稳。
很多企业把精力全花在选大模型上,知识库草草搭一个就上线,效果不好就怪模型不行。方向搞反了。先把知识库做扎实,RAG的效果自然就上来了。