当前位置: 首页 > news >正文

php本地搭建知识库实现rag遇到的各种问题解决方式

1、向量化的问题,中文的话,使用尽量使用国内的嵌入模型,国外的虽然支持中文,但是还是比不上国内专门针对中文的优化

本地使用ollama 搭建的话 ,我使用的是   quentinz/bge-large-zh-v1.5:latest

 

2、不规则的pdf文件,无法使用pdf插件读取内容问题,我是php 使用 smalot/pdfparser 包的

遇到不规则pdf文件时  使用 Imagick 将pdf 文件  转为图片,再使用多模态模型,读取图片内容

多模态模型使用的是ollama里面的 qwen2.5vl:7b,识别率非常高

 

3、文件的内容主题不突出问题,比如有一份文件叫QQ飞车攻略,但是内容全篇都没有QQ飞车  攻略 这几个字,当用户问题是QQ飞车有什么攻略,向量化搜索完全匹配不上

我是先将整个文件内容 包括文件标题  扔给大模型  让大模型大概总结一下 文本内容,然后作为一个文件块进行向量化 保存

 

4、搜索结果 权重排序不理想问题,往往不相关的文件排在前面

将搜索返回的内容,扔给大模型,让大模型针对问题 和 内容进行 打分排序

 

5、用户上下文提问关联问题

让大模型根据用户的历史提问,生成一个完整的新的问题,比如用户第一次提问 介绍一下xxx系统,第二次提问 重点介绍一下财务功能模块

那么让大模型重写后的提问就变成了,重点介绍一下xxx系统的财务功能模块,这样这个问题就能命中xxx系统的文件块

 

6、计算类的问题,这个完全无解

比如用户把很多excel文件都上传知识库,但是每个excel里面的数据,结构都不同,此时用户提问  今年公司的订单数有多少

这个完全无解啊,哦尼酱

http://www.rkmt.cn/news/7864.html

相关文章:

  • 【字节跳动】LLM大模型算法面试题:大模型 LLM的架构介绍? - 教程
  • 解码C语言指针
  • windows下Qt调用fftw库
  • jenkins的安装和配置
  • 深入解析:【Day 52 】Linux-Jenkins
  • 本土开发者如何选择代码管理工具?Gitee与GitHub深度对比解析
  • C++ std::string
  • MathType数学公式编辑器v7.9.1
  • 2025 ICPC网络赛第一场 L cover
  • 实用指南:22 C++11 初始化新姿势:{} 统一初始化(省等号)+initializer_list 底层解析
  • 第九届电气、机械与计算机工程国际学术会议(ICEMCE 2025)
  • 第六届大数据、人工智能与物联网工程国际会议(ICBAIE 2025)
  • 文件自动同步软件用哪个好,高效选择指南
  • 【初赛】指针 - Slayer
  • 国产化FPGA-2050-基于JFMK50T4(XC7A50T)的核心板
  • hbase学习2
  • MySQL迁移至GreatSQL后,timestamp字段插入报错解析
  • 大模型decoder中权重矩阵的理解 - 实践
  • 【初赛】数 - Slayer
  • 【初赛】链表 - Slayer
  • 第2章 zynq开发板FSBL的生成和NAND烧录
  • 工具大全
  • RocketMQ vs kafka
  • LobeChat搭建
  • url测试脚本2
  • C# 2025年6-9月TIOBE排名增长及未来展望
  • 飞算 JavaAI 启用体验全解析
  • 采用tree命令导出文件夹/文件的目录树(linux)
  • 深入解析 JVM 类加载机制:从字节码到运行时对象
  • 博弈论学习(第二天)