当前位置: 首页 > news >正文

LongLLMLingua 核心原理:对比困惑度实现提示词压缩

LongLLMLingua 核心原理:问题感知的粗+细两级压缩

LongLLMLingua 是微软专门为长上下文RAG场景优化的提示词压缩技术,它在原始LLMLingua"由粗到细"压缩架构的基础上,加入了革命性的问题感知能力——压缩时不再只看语言本身的信息量,而是同时衡量"这个内容对回答用户问题有多重要"。

这就是为什么它能做到:压缩4倍的同时,准确率反而比原始长prompt提高21.4%(在NaturalQuestions基准上)。

一、原始LLMLingua的粗+细压缩基础

原始LLMLingua已经采用了"先砍大块,再修细节"的两级压缩策略,LongLLMLingua完全继承了这个架构:

1. 粗粒度压缩(第一级)

  • 目标:快速砍掉完全无关的大段内容
  • 做法:把prompt分成段落/句子/文档块,用小模型(如Llama-2-7B)计算每个块的困惑度(PPL)
  • 逻辑:困惑度越低 → 模型越容易预测 → 内容越冗余 → 可以优先删除
  • 效果:通常能先砍掉50%-70%的完全无关内容

2. 细粒度压缩(第二级)

http://www.rkmt.cn/news/1383909.html

相关文章:

  • 对比按量计费与Token Plan,我的月度成本管理心得
  • Java语法进阶篇
  • 开源权重、商业闭源、衍生模型——DeepSeek知识产权边界全解析,一文厘清5类侵权陷阱
  • Python 3、VS Code、PyCharm 安装常见问题及解决方案大全(Windows/Mac/Linux)
  • 如何突破百度网盘下载限制:Python解析工具完整指南
  • 如何在3分钟内为任何活动搭建专业级滚动抽奖系统?Magpie-LuckyDraw全平台开源方案深度解析
  • 全球文字的数字桥梁:Noto字体项目的技术解析与实践指南
  • 5分钟搭建Windows虚拟显示器:游戏串流与远程工作的终极方案
  • ARM SME2 FMAX指令:浮点向量运算优化指南
  • LaTeX公式一键转Word:3步告别数学公式编辑烦恼
  • 打造XBEE封装BLE112蓝牙模块:硬件设计、射频布局与调试全攻略
  • 2026年北京朝阳搬家公司多维度精选推荐四家正规公司 - 余小铁
  • 1688运营培训/询盘成本从500元降到63.9!1688运营培训还原1688真实玩法
  • 告别Postman!用APIfox搞定接口测试+自动化,这份保姆级教程带你从环境配置到报告生成
  • 【安全加固】Claude Code v2.1.149 发布:堵截 PowerShell 越权路径漏洞,账单明细精准透视
  • 【Linux:文件】Linux 动静态库详解:动态链接与动态库加载深度解析
  • 大模型应用开发入门指南:从基础到实践
  • 十年以上经验的建站公司推荐|策划强、落地稳的网站制作公司盘点
  • 番禺区搬家公司电话 高效快速搬家服务全攻略 - 从来都是英雄出少年
  • 终极指南:5步快速定位Windows热键冲突元凶
  • 私有化视频会议解决方案/智能会议管理系统EasyDSS筑牢企业远程培训核心技术底座
  • 告别DLL缺失烦恼!Visual C++运行库合集一键搞定Windows应用依赖问题
  • Transformer大揭秘:ChatGPT背后的秘密,普通人也能看懂!
  • 179个核心职位,50个公司分类,中国大模型产业全栈
  • 解决方法:庐山派K230接串口没识别到端口问题
  • 长期使用Taotoken聚合接口对项目运维复杂度的实际影响观察
  • DMA Buffer Cache同步的批处理优化及高通平台的实践
  • [Dify实战] 从 Docker Compose 起步,怎么先搭出一个可验证的 Dify 本地环境?
  • 2024数证杯决赛个人赛
  • KylinOS KYSEC联网控制实战:从临时关闭到永久禁用netctl的完整命令指南