POI 搜索新方向:向量重排打通语义与空间的闭环
POI 搜索正在从浅层关键词匹配走向深层意图理解。用户搜索“安静有插座适合加班的咖啡厅”,不仅涉及文本语义(安静、插座、加班),还隐含空间可达性、实时营业状态和个性化偏好。传统“粗召-精排”框架中,重排模型高度依赖人工特征,难以细腻捕捉这类复合意图,空间信息也常被压缩为一个直线距离标量,丢失了路网、区域功能和动态上下文。向量重排的出现,正是为了用稠密向量统一表达查询、POI、用户和时空场景,在重排阶段构建完全可微的语义匹配空间,让排序真正贴近用户的真实需求。
突破多域表征瓶颈
向量重排的第一个关键在于多模态编码。文本端不再只做双塔点积,而是在重排时引入迟交互机制:利用预训练语言模型将查询和 POI 的标题、评论、标签分别编码为多个 token 向量,保留细粒度语义信息。空间端则将经纬度通过多尺度地理编码(如 Uber H3 或 Google S2 网格)映射为可学习的空间嵌入,再结合路网图神经网络生成的节点向量,使模型感知真实可达性——例如能区分“河对岸直线距离 50 米但需绕行 1 公里”和“前方 300 米但步行直达”的本质差异。时间、天气、实时拥挤度等动态上下文,以及用户长期行为序列和当前会话意图,都被编码为时序或会话向量,与查询、POI 向量一同注入交互层。
迟交互与空间感知的融合计算
重排阶段的计算采用“迟交互注意力”架构。查询和候选 POI 的 token 向量先进行压缩式交互,例如通过 MaxSim 操作计算每个查询 token 与 POI 最相关 token 的相似度并聚合,极大保留了细粒度匹配信号。随后,该语义交互向量与空间、时间、用户等上下文向量拼接,送入一个轻量级 MLP 输出最终排序分。这种方式在数百条候选上可实时完成,既超越了静态点积的浅层交互,又避免了完全交叉编码器的高延迟。训练时,损失函数直接优化列表级指标(如 LambdaRank),并重点构造空间感知的偏序对:刻意选择“语义高度相关但距离较远”和“距离近但语义无关”的样本形成四元组,通过对比学习让模型学会精准权衡相关性与可达性,而不是简单记忆“近的就是好”。
从相关性到可解释决策
向量重排带来的不仅是排序精度的提升。由于向量空间各维度可对应可学习的概念,我们能够将某条 POI 排名靠前的原因分解为“语义匹配贡献+空间便利贡献+个性化偏好贡献”,从而向用户给出自然解释,如“该咖啡厅因为静谧、提供插座且距离您步行 6 分钟,优先推荐”。复合意图也被真正激活:搜索“购物兼晚饭”时,模型能在向量交互层同时激活“购物氛围”“餐饮口味”以及“商场内是否有优质餐厅”的隐含关联,自动提升商场内含有高评价餐厅的 POI。对于新入驻零行为数据的 POI,仅依赖标题、坐标和图片的编码向量,就能与语义丰富的查询有效交互,冷启动排序质量远超依赖统计特征的传统模型。
实际落地中,某本地生活平台将 LightGBM 重排器替换为向量重排模型后,长尾语义查询的无结果率下降 17%,点击率提升 9.2%;融合路网向量后,跨区域到店转化率提升 5.8%;动态天气和拥挤度注入更让恶劣天气下室内 POI 点击占比提升超 12%。未来,生成式重排与大模型的结合将使搜索具备“琢磨再决定”的推理能力,完成从找到地点到完成体验的跨越。
维智科技Lothub平台(维智物联全域定位)已将向量重排技术产品化,提供可接入的高性能 POI 搜索服务。
