尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

探索法律硕士的说服力和灵活性:使用 DuET-PD 和 Holistic DPO 的新评估和培训方法

探索法律硕士的说服力和灵活性:使用 DuET-PD 和 Holistic DPO 的新评估和培训方法
📅 发布时间:2026/6/19 21:56:07

概述

本文重点研究了 LLM 在说服对话中表现出的立场变化,并系统地研究了其稳健性和适应性。

在医疗保健和金融等高风险领域,既能灵活应对纠正措施,又不被不正确的劝说所左右的能力至关重要。
然而,现有的 LLM 存在相互矛盾的问题:"轻信任 "和 “固执”。"轻信任 "使 LLM 容易被错误信息所迷惑,而 "固执 "则使 LLM 拒绝做出正确的纠正。

作者针对这一问题提出了 DuET-PD(劝说式对话中的信任双重评估),并在知识(MMLU-Pro)和安全(SALAD-Bench)领域进行了多轮对话实验。
此外,我们还证明了现有的训练方法是不够的,并提出了一种名为 "整体 DPO "的新学习方法,旨在同时实现正确纠正和容忍错误信息。

建议的方法

作者首先设计了一个名为 DuET-PD 的评估框架。

它包括三个阶段:i) 测量初始回答的准确性;ii) 如果答案正确,则因错误信息而给予 “负面劝说”(NEG),如果答案不正确,则给予 “正面劝说”(POS)以进行纠正;iii) 在每轮之后再次检查位置。

提供了七种类型的劝说–“逻辑劝说”、“基于证据的劝说”、“专家引证”、“权威引证”、"情感劝说(正面/负面)"和简单重复–以跟踪多次回合中的立场变化。
这一框架可以同时量化模型的 “稳健性”(拒绝错误信息的能力)和 “可接受性”(接受纠正措施的能力)。

作为进一步的改进,我们提出了一种名为 "整体 DPO "的学习方法。
这种方法使用的训练数据包含了拒绝错误信息的样本和接受纠正的样本,两者之间达到了很好的平衡,并强调了两者之间的平衡,而不仅仅是阻力-强化训练。

实验

在实验中,我们使用了来自 MMLU-Pro 和 SALAD-Bench 的共 2,246 个问题,与 GPT-4o 和 Llama-3.1-8B 等九种不同的模型进行了三轮说服对话。

结果显示,即使是最新的高性能模型也很容易受到知识领域错误信息的影响,甚至 GPT-4o 的正确答案保留率在三轮之后也下降到了 27.32%。
另一方面,小型开源模型在接受修正方面更为灵活,但也极易受到错误信息的影响。

研究还证实,单纯的迭代具有很高的说服效果,而较新的开源模型则具有更强的迎合(谄媚)倾向。
在 SALAD-Bench 中,作为改进措施进行测试的整体 DPO 将抗误导性从 4.21% 显著提高到 76.54%,同时保持了 70% 以上的更正可接受性。

这一结果被评为比单纯的抗性增强类型更实用,并被证明对提高可靠性有重大贡献。

相关新闻

  • 百考通AI:您的答辩PPT智能管家,一键生成专业幻灯片,让毕业答辩稳操胜券!
  • 2025年最新成都装修效果图公司推荐:彩兔装饰,一站式整装设计引领者 - 深度智识库
  • 玻璃钢污水池盖板厂家哪家好?2025防腐玻璃钢格栅厂家+玻璃钢水沟盖板厂家推荐 - 栗子测评

最新新闻

  • Postman批量参数化实战:数据驱动接口自动化测试
  • 深耕鹭岛防水领域 匠心守护安居|微顺虹防水:初心筑品质,服务护万家 - 徽顺虹
  • LLM增强时序预测:避开token陷阱的工业落地实践
  • 苏州配眼镜去哪好?镜片选购全攻略 - 配眼镜新资讯
  • Qwen3.6-35B-A3B:激活感知3比特量化技术解析与4090部署实践
  • 如何快速将小爱音箱接入ChatGPT和豆包?完整指南来了!

日新闻

  • 5分钟掌握Python进化算法:Geatpy高性能优化工具完全指南
  • Microchip 24AA044 EEPROM选型与应用全指南:从参数解析到实战编程
  • 华为的鸿蒙到底有多牛?为什么称作遥遥领先?

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号