当前位置: 首页 > news >正文

通过局部与全局上下文设定答案选择新标准

在实用的问答系统中,经常使用一种称为答案选择的技术。给定一个问题(例如,“塞雷娜·威廉姆斯何时出生?”),系统首先执行基于关键词的普通文档搜索,然后从检索到的文档中选择一个句子作为答案。

如今,大多数答案选择系统都是基于问题和候选答案集训练的神经网络:给定一个问题,它们必须学会从候选句子中选择正确答案。在运行时,它们独立考虑每个候选句子,并估计其成为正确答案的概率。

但这种方法存在局限性。想象一篇文章的开头是“塞雷娜·威廉姆斯是美国网球运动员。她出生于1981年9月26日。”如果系统学会了独立考虑候选答案,它将别无选择,只能给“1981年9月26日”分配一个很低的概率,因为它无法知道“她”指的是谁。同样,一个文档可能只在其标题中提到了塞雷娜·威廉姆斯的名字。在这种情况下,准确的答案选择需要更全局的上下文感知。

在即将于春季发表的两篇论文中,研究人员探讨了如何在答案选择系统中添加上下文,同时不产生过高的计算成本。

第一篇论文将于本月底在欧洲信息检索会议(ECIR)上发表。该文描述了一种利用局部和全局上下文显著提高答案选择精度的技术。

三周后,在欧洲计算语言学协会会议(EACL)上,将发表另一篇论文,介绍一种更有效的添加全局上下文的技术,该技术涉及对少量选定句子的向量表示。

通过将这种全局上下文方法与早期论文中的局部上下文方法相结合,研究人员在两项基准数据集上,相对于最先进的答案选择系统,分别实现了6%和11%的精度提升。

局部上下文

在两篇论文中,所有模型都建立在先前于AAAI 2020会议上发表的模型基础之上,该模型目前仍是答案选择任务的最先进技术。该模型将预训练的、基于Transformer的语言模型(如BERT)适配到答案选择任务。其输入是拼接的问题-答案对。

在ECIR论文中,为了向基本模型添加局部上下文,研究人员扩展了输入,以包含源文本中位于候选答案前后的句子。输入的每个词都经过三种嵌入(即编码为固定长度的向量)。一种是标准的词嵌入,它将语义内容编码为嵌入空间中的位置。第二种是位置嵌入,用于编码词在其源句子中的位置。第三种是句子嵌入,用于指示词来自哪个输入句子。这使得模型能够学习候选答案中的词与其前后句子中的词之间的关系。

研究还探索了一种捕获全局上下文的技术,该技术使用一个50,000维的向量来记录源文本中出现的、属于一个50,000词词典的每个词的计数。研究人员使用一种称为随机投影的技术将该向量降维到768维,与局部上下文向量大小相同。

在测试中,研究人员将新系统与不考虑上下文的最先进的基于Transformer的系统,以及一个集成系统基线(该系统为每个候选答案及其相邻句子使用单独的编码器)进行了比较。集成系统基线有助于衡量模型在多大程度上依赖于相邻句子间关系的推断,而不是简单地利用它们所包含的额外信息。

在三个不同的数据集和两种不同的精度度量标准上,新模型在所有情况下都优于基线。实际上,集成系统的表现比其他两者差得多,可能是因为上下文句子中的额外信息使其混淆。

全局上下文

在EACL论文中,研究人员考虑了另外两种为模型添加全局上下文的方法。两种方法都在源文本中搜索与问题和候选答案都密切相关的少数句子(二到五个句子效果最佳)。然后将这些句子作为附加输入添加到模型中。

两种方法以不同的方式衡量句子之间的关系。一种方法使用n-gram重叠。也就是说,它将每个句子分解为单字、双字和三字序列,并测量跨句子间这些序列的重叠度。

另一种方法使用上下文词嵌入,根据句子在嵌入空间中的接近程度来确定句子之间的语义关系。在实验中,这是效果最好的方法。

在实验中,研究人员使用了三种不同的架构来探索这种上下文感知的答案选择方法。在所有三种架构中,输入都包含了局部上下文信息(如ECIR论文所述)和全局上下文信息。

在第一种架构中,研究人员只是将全局上下文句子与问题、候选答案和局部上下文句子拼接起来。

第二种架构使用集成方法。它接收两个输入向量:一个将问题和候选答案与局部上下文句子拼接,另一个将它们与全局上下文句子拼接。这两个输入向量分别传递给独立的编码器,编码器产生独立的向量表示以供进一步处理。研究人员推测这会提高精度,但代价是更高的计算成本。

第三种架构使用多路注意力机制,试图以较低成本捕获集成架构的部分优势。多路注意力模型使用单个编码器为所有输入生成表示。然后将这些表示送入三个独立的注意力块。第一个注意力块迫使模型联合检查问题、答案和局部上下文;第二个注意力块专注于局部和全局上下文之间的关系;最后一个注意力块捕获整个序列中的关系。因此,该架构保留了集成方法的部分信息隔离特性。

在测试中,集成方法表现最佳,但多路注意力模型紧随其后,在评估所使用的三项指标上,精度下降幅度在0.1%到1%之间。

然而,所有三种上下文感知模型的表现都优于最先进的基线,为答案选择精度设定了新的标准。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.rkmt.cn/news/114834.html

相关文章:

  • 2025年北京刑事辩护靠谱律师律所年度排行榜,专业刑事辩护 - myqiye
  • 谁是TOP1?上海市青浦区自建房评测排行榜 + 真实建房案例参考 - 苏木2025
  • 揭秘靠谱UV硅油涂布机服务商与生产企业 - myqiye
  • 天津滨海新区全域口碑第一!佰瑞20年专攻汉沽老房/大港海景房,装修零踩坑 - 品牌智鉴榜
  • vue基于springboot的连锁超市销售商城 进销存员工与分析系统的设计与实现
  • 【Java毕设源码分享】基于springboot+vue的实验室安全考试系统设计与实现(程序+文档+代码讲解+一条龙定制)
  • 【Java毕设源码分享】基于springboot+vue的家政服务系统的设计与实现(程序+文档+代码讲解+一条龙定制)
  • 系统设计:高并发企业级限流方案+原理
  • Webtop Docker 容器化部署指南:基于浏览器的Linux桌面环境
  • 【Java毕设源码分享】基于springboot+vue的宠物猫售卖管理系统设计与实现(程序+文档+代码讲解+一条龙定制)
  • 提升企业数据安全的文件外发系统有哪些特点与优势
  • 2025年潮州专业新媒体运营公司排行榜,推荐专业诚信的新媒体 - 工业推荐榜
  • 2025 年 12 月活性炭厂家权威推荐榜:蜂窝/柱状/颗粒全系解析,废气净化与深度过滤的工业级优选方案 - 品牌企业推荐师(官方)
  • 面试官一句话把我问懵了:Java 都不快了,为什么公司还在用?
  • 高质量财务分析报告:全流程指南与实操技巧
  • 2025年12月湖南环保家装板材,全屋定制家装板材,好看家装板材厂家测评:甲醛释放量达标品牌推荐 - 品牌鉴赏师
  • 情感强度滑动调节功能上线!EmotiVoice更灵活
  • 告别实习报告“挠头时刻”!百考通AI智能助手,5分钟生成专业、高分实践报告
  • 3DIC AI芯片中的信号完整性系统分析
  • 前端学习笔记——Vite + Vue 3 + TypeScript + Vue Router 4 + Pinia + Element Plus + Axios 项目从 0 到 1 的环境搭建 - 实践
  • 抓住起涨信号:通达信〖一阳指二阳指〗主图+副图+选股指标,再度放量上行,一举突破关键压力位!
  • 告别熬夜!百考通AI一键生成毕业答辩PPT,让你告别“做PPT恐惧症”
  • 推荐一个开源神库!用一句话就能“变出”一套专业级PPT文稿!
  • 某211高校讲师晒工资条,网友:公积金数额令人瞩目...
  • MyBatis-Flex 来了!完爆MyBatis-Plus?
  • 小鼠T细胞激活:如何系统解析其发育分化与免疫功能表征?
  • 小鼠T细胞激活试剂盒:如何通过CD3/CD28双信号系统实现高效免疫激活?
  • 泳池漆源头厂家推荐,看看哪家性价比高? - mypinpai
  • 解决孩子叛逆的学校哪家强?矫正孩子叛逆的学校选哪家? - 工业推荐榜
  • 2025年自动化变频控制柜厂家哪家强?这份榜单告诉你,物联网远程控制柜/PLC控制柜/水泵专用控制柜自动化变频控制柜公司排行榜 - 品牌推荐师