当前位置：首页 > news >正文

LongLLMLingua 核心原理：对比困惑度实现提示词压缩

news 2026/6/10 16:17:41

LongLLMLingua 核心原理：问题感知的粗+细两级压缩

LongLLMLingua 是微软专门为长上下文RAG场景优化的提示词压缩技术，它在原始LLMLingua"由粗到细"压缩架构的基础上，加入了革命性的问题感知能力——压缩时不再只看语言本身的信息量，而是同时衡量"这个内容对回答用户问题有多重要"。

这就是为什么它能做到：压缩4倍的同时，准确率反而比原始长prompt提高21.4%（在NaturalQuestions基准上）。

一、原始LLMLingua的粗+细压缩基础

原始LLMLingua已经采用了"先砍大块，再修细节"的两级压缩策略，LongLLMLingua完全继承了这个架构：

1. 粗粒度压缩（第一级）

目标：快速砍掉完全无关的大段内容
做法：把prompt分成段落/句子/文档块，用小模型（如Llama-2-7B）计算每个块的困惑度（PPL）
逻辑：困惑度越低 → 模型越容易预测 → 内容越冗余 → 可以优先删除
效果：通常能先砍掉50%-70%的完全无关内容

2. 细粒度压缩（第二级）

http://www.rkmt.cn/news/1383909.html

相关文章：

对比按量计费与Token Plan，我的月度成本管理心得

Java语法进阶篇

开源权重、商业闭源、衍生模型——DeepSeek知识产权边界全解析，一文厘清5类侵权陷阱

Python 3、VS Code、PyCharm 安装常见问题及解决方案大全（Windows/Mac/Linux）

如何突破百度网盘下载限制：Python解析工具完整指南

如何在3分钟内为任何活动搭建专业级滚动抽奖系统？Magpie-LuckyDraw全平台开源方案深度解析

全球文字的数字桥梁：Noto字体项目的技术解析与实践指南

5分钟搭建Windows虚拟显示器：游戏串流与远程工作的终极方案

ARM SME2 FMAX指令：浮点向量运算优化指南

LaTeX公式一键转Word：3步告别数学公式编辑烦恼

打造XBEE封装BLE112蓝牙模块：硬件设计、射频布局与调试全攻略

2026年北京朝阳搬家公司多维度精选推荐四家正规公司 - 余小铁

1688运营培训/询盘成本从500元降到63.9！1688运营培训还原1688真实玩法

告别Postman！用APIfox搞定接口测试+自动化，这份保姆级教程带你从环境配置到报告生成

【安全加固】Claude Code v2.1.149 发布：堵截 PowerShell 越权路径漏洞，账单明细精准透视

【Linux：文件】Linux 动静态库详解：动态链接与动态库加载深度解析

大模型应用开发入门指南：从基础到实践

十年以上经验的建站公司推荐｜策划强、落地稳的网站制作公司盘点

番禺区搬家公司电话高效快速搬家服务全攻略 - 从来都是英雄出少年

终极指南：5步快速定位Windows热键冲突元凶

私有化视频会议解决方案/智能会议管理系统EasyDSS筑牢企业远程培训核心技术底座

告别DLL缺失烦恼！Visual C++运行库合集一键搞定Windows应用依赖问题

Transformer大揭秘：ChatGPT背后的秘密，普通人也能看懂！

179个核心职位，50个公司分类，中国大模型产业全栈

解决方法：庐山派K230接串口没识别到端口问题

长期使用Taotoken聚合接口对项目运维复杂度的实际影响观察

DMA Buffer Cache同步的批处理优化及高通平台的实践

[Dify实战] 从 Docker Compose 起步，怎么先搭出一个可验证的 Dify 本地环境？

2024数证杯决赛个人赛

KylinOS KYSEC联网控制实战：从临时关闭到永久禁用netctl的完整命令指南