当前位置: 首页 > news >正文

告别大模型“健忘症”!长期记忆机制深度解析与应用实战,让AI更智能!

【引言】

前面我们提到,要想AI给出更加精准的答案,需求我们在向AI提问时,先给出尽可能详细的问题描述,比如我是谁、我要做什么事情、遇到到了什么问题、对解决方案的偏好要求。

举个例子,我需要开车回老家,我希望AI给我规划一条开车回家的路线,但需要避开高速,因为高速要收费。

在上述问题中,我需要告诉AI几个关键信息:

上述4个要点,我在第一次回家的时候可以全部告知AI,但第二次第三次回家的时候,其实我只想告知前两个信息,他们动态变化的,而后两个信息,“老家在哪?”属于固定地址信,息不会变,“避开收费站”属于个人驾驶偏好,基本也不会变,对这些固定不变的信息,我不希望每次都重复。

针对上述示例,由于大模型上下文长度限制,导致它不可能在相隔很长时间后的对话中,仍然记住我上次回老家规划路线的相关信息,我就不得不再次重复相同的信息输入给模型。

针对这种情况,我们希望AI拥有“长期记忆”,能够记住这些不变的信息。

【什么是长期记忆】

长期记忆是解决大模型因为其上下文长度限制或注意力机制,而导致“健忘”的问题,帮助其能记住一些长期不变、个人偏好,或随着时间推移按规律变化的信息,让大模型在计算个性化问题时,更加精准且有更好的用户体验。

【长期记忆主要解决哪些问题】

克服上下文报文长度限制:传统 Transformer 架构的大模型受注意力机制计算成本影响,上下文报文长度有限,新会话会重置初始状态,出现 “健忘” 问题。长期记忆机制可通过外部存储等方式,让模型能够利用更长时间跨度的信息,突破这一限制。

降低生成幻觉风险:长期记忆存储的是用户输入的真实事件及相关信息,在大模型计算前,将用户真实的记忆信息和大模型自身知识想结合,可以更好的降低大模型只通过自身知识在生成输出时,产生的幻觉问题,让输出逻辑围绕真实记忆展开,而非架空逻辑的自洽。

实现跨会话知识复用:长期记忆可存储用户的个人偏好、历史对话内容等信息,以便在多轮跨会话对话中,提供更加连续的个性化服务。

支持复杂推理:大模型在处理一些复杂任务时,需要能够关联不同的事实进行多跳推理,并识别模式。长期记忆可以为模型提供丰富的历史信息,帮助模型进行更深入的推理和分析,例如知识图谱作为长期记忆的一种形式,可通过图遍历的方式获取信息,支持模型跨多个跳追踪关系,更好地进行复杂推理和决策。

【如何实现长期记忆】

目前主流的解决方案,是以外挂记忆库的方式,通过独立于模型外的数据库存储长期记忆,模型根据需要检索调用。

结构化数据库:传统系统存储用户相关信息的结构化数据库,如用户ID、头像、身高、年龄、性别、爱好等,便于精确查询。

非结构化数据库:将用户的历史对话、情感偏好、评论等非结构化数据,转化为 “向量嵌入”(数字向量),存入向量数据库,使用时通过向量检索查询。

知识图谱:对用户行为的实体和关系,构建知识图谱进行存储,如用户经常去哪些地方旅游、用户喜欢玩哪些游戏、用户喜欢购买哪些电子产品等,通过存储实体间的关联关系,以更好的支持复杂逻辑推理。

【典型的应用场景】

个人助手:手机厂商为用户提供基于手机平台的个人AI助理服务,基于长期记忆机制,收集和更新用户的个性化信息,帮助客户提供个性化、精准、便捷的AI服务。如记忆客户的饮食偏好,在客户点外卖时,可以推荐基于个人口味的餐饮店铺和菜品。

客户服务:电商平台的客服对话场景,调取客户的未完成订单信息,结合客户往前的商品评价及投诉情形,为客户提供满意的客服解决方案,提升客户售前、售后服务质量。如客户针对商品质量问题,更倾向于补偿优惠券,而非退货退款,则既可以解决售后质量问题,避免客户流失,优惠券同时可以带来客户复购,提升未来的销量。

医疗健康:医院为病人提供针对个体身体健康水平的治疗方案,收集客户的病史信息,结合当前病症,以及客户的治疗偏好(激进或保守),推荐合理的治疗方式。医疗行业的解决方案,最终还需要医生评估,以及同病人协商再确定。

【结束语】

在大模型的应用实践过程中,以下情形的存在,可能需要长期记忆机制的支持:

信息需要跨会话复用:同一用户在不同时间(如今天和明天)、不同场景(如手机端和电脑端)交互,需要调用之前的信息。

任务需要持续追踪:任务不是 “一次性完成”(如问答),而是 “分步骤、跨时间” 进行(如学习、项目管理),需要记录进度和历史状态。

个性化需求强:需要基于用户的独特属性(如偏好、病史、习惯)提供定制化服务,而非通用回答。

同时,长期记忆机制更多的时候需要收集用户的隐私信息,在实践中需要符合国家和地区对用户隐私信息收集和使用的相关法律法规。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!


第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

http://www.rkmt.cn/news/158031.html

相关文章:

  • 2025冲床机械手厂家/冲压机械手生产商口碑榜单 - 栗子测评
  • 随机选取1000条序列
  • 2025年论文降重降AI工具横向测评,适配知网,维普等AIGC查重系统! - 还在做实验的师兄
  • Qwen3 炸场!LangChain 搭建高性能 RAG 系统实测:速度提升惊人,效果稳了!
  • 2025长三角团餐服务机构排名TOP5:比较好的团餐服务品牌企业深度测评 - mypinpai
  • milvus docker-compose配置文件下载
  • 智能体Manus的诞生(从AutoGLM到认知跃迁的技术突破)
  • 学长亲荐9个AI论文软件,本科生论文写作不求人!
  • 2025年新疆口碑不错的西点学校排名:西点学校哪家好? - mypinpai
  • 论文降AI率工具如何选择?2025年10个主流降AI网站综合测评对比 - 还在做实验的师兄
  • 2025板材防潮防水材料生产企业TOP5权威推荐:甄选优质合作方 - 工业品牌热点
  • 业绩数据分析看板:破解管理低效难题,实现企业持续优化的核心工具
  • 2025年四季度总结:飞秒光频梳/光纤光频梳行业标杆企业,哪个品牌口碑好? - 品牌推荐大师1
  • 2025恒温水浴服务商TOP5权威推荐:正规厂家甄选指南 - myqiye
  • PaddlePaddle财经资讯自动播报系统
  • AbMole丨重组脯氨酰羧肽酶PRCP:代谢与心血管模型研究的重要工具
  • 紧急预警:Open-AutoGLM无响应可能正在浪费你的算力资源!
  • 从ImportError到Segmentation Fault,全面解读Open-AutoGLM 6类致命报错
  • 密度估计--第3柱(二)
  • 从安装失败到秒级响应:我在macOS上调试Open-AutoGLM的14天实战复盘
  • 携程礼品卡回收指南,回收一般多少折 - 京回收小程序
  • Open-AutoGLM网页使用全解析:20年经验专家总结的4大核心要点
  • 2025-2026CNAS实验室品牌与CMA实验室建设品牌推荐榜单 - 品牌推荐大师1
  • 2025年口碑不错的猎头公司推荐,猎头实力公司与比较不错的猎头机构全解析 - 工业推荐榜
  • 环境配置还是依赖冲突?,深度剖析Open-AutoGLM运行报错根源
  • 编码器(Encoder) / 解码器(Decoder) / 编码器-解码器(Encoder-Decoder)架构
  • PaddlePaddle生态全景图:你不知道的强大工具链
  • 汉字对比
  • 2025年度实验型过滤洗涤干燥三合一设备厂家排行榜 - myqiye
  • PaddlePaddle镜像支持ONNX导出吗?模型转换实测分享