当前位置：首页 > news >正文

双视角训练策略提升审稿人匹配准确率

news 2026/6/9 9:01:15

1. 双视角训练策略在审稿人匹配中的创新实践

学术会议和期刊的审稿人匹配一直是个棘手的难题。传统方法往往只从单一视角出发——要么根据论文内容寻找相关领域的专家，要么根据审稿人过往的研究方向推荐论文。这种单向思维存在明显局限：前者忽略了审稿人研究兴趣的动态变化，后者则无法捕捉论文需求的多样性。

我们团队基于Qwen3-Embedding-8B模型，创新性地提出了双视角训练策略。这个想法的灵感来源于实际观察：优秀的审稿匹配应该像一场精心安排的相亲，既要了解"论文需要什么样的专家"，也要知道"专家擅长评审什么样的论文"。这种双向思维带来了显著的效果提升——在LR-PC（论文中心）和LR-RC（审稿人中心）两个基准测试集上，我们的方法分别达到了76.89%和75.25%的准确率，综合平均精度77.41%，比单视角方法提升了2.15个百分点。

关键突破：不同于简单拼接两种数据，我们设计了一个统一的训练目标函数，使模型能够自动学习两种视角间的关联性和互补性。这就像教会一个学生同时用作者和读者的视角来理解文本，从而获得更全面的理解。

2. 核心架构与技术实现细节

2.1 模型选型与改造

我们选择Qwen3-Embedding-8B作为基础模型，主要基于三点考虑：

该模型在中文和英文学术文本上都表现出色
80亿参数的规模能在效果和效率间取得平衡
支持长文本输入（最大2048token）适合处理论文摘要

技术实现上，我们采用了LoRA（Low-Rank Adaptation）进行微调，这是一种参数高效的微调方法。具体配置如下：

LoRA秩（r）：16
Alpha值：32
Dropout率：0.1
学习率：2.3e-5

这种配置下，新增的可训练参数仅占原模型的0.2%，却能达到接近全参数微调的效果。我们在NVIDIA A800-80G GPU上完成了所有实验，每个训练周期约需3小时。

2.2 双视角数据构建

数据是模型成功的关键。我们构建了两种类型的偏好三元组：

论文中心视角(p, r+, r-)：
- 正例：论文与真正审阅过它的专家
- 负例：论文与随机抽样的不相关专家
- 目标：学习"这篇论文需要什么样的审稿人"
审稿人中心视角(r, p+, p-)：
- 正例：专家与其真正评审过的论文
- 负例：专家与随机抽样的不相关论文
- 目标：学习"这位专家适合审什么论文"

我们特别注重负样本的质量控制。不同于简单的随机负采样，我们采用了"困难负样本"策略——选择那些在嵌入空间距离较近但不匹配的样本，这显著提升了模型的判别能力。

3. 训练策略与优化技巧

3.1 联合训练目标

我们设计了一个统一的损失函数，同时优化两个视角：

L = λ₁L_pc + λ₂L_rc + λ₃L_reg

其中：

L_pc是论文中心视角的对比损失
L_rc是审稿人中心视角的对比损失
L_reg是正则化项
λ₁=0.915, λ₂=1.0是通过网格搜索确定的最佳权重

这种设计使得模型能够自动平衡两种视角的信号。实验表明，联合训练比单独训练两个模型后融合的效果更好，验证了两种视角间的协同效应。

3.2 池化策略比较

如何聚合一个审稿人多篇论文的嵌入表示是个关键问题。我们比较了三种策略：

策略	描述	优点	缺点
均值池化	取所有论文嵌入的平均值	稳定，抗噪性强	可能稀释关键论文的影响
75分位数	取相似度排名前25%的均值	突出核心专长	对稀疏profile不友好
最大值	取相似度最高的单篇论文	强调最强相关性	忽略多样性