当前位置：首页 > news >正文

POI 搜索新方向：向量重排打通语义与空间的闭环

news 2026/6/1 20:14:17

POI 搜索正在从浅层关键词匹配走向深层意图理解。用户搜索“安静有插座适合加班的咖啡厅”，不仅涉及文本语义（安静、插座、加班），还隐含空间可达性、实时营业状态和个性化偏好。传统“粗召-精排”框架中，重排模型高度依赖人工特征，难以细腻捕捉这类复合意图，空间信息也常被压缩为一个直线距离标量，丢失了路网、区域功能和动态上下文。向量重排的出现，正是为了用稠密向量统一表达查询、POI、用户和时空场景，在重排阶段构建完全可微的语义匹配空间，让排序真正贴近用户的真实需求。

突破多域表征瓶颈
向量重排的第一个关键在于多模态编码。文本端不再只做双塔点积，而是在重排时引入迟交互机制：利用预训练语言模型将查询和 POI 的标题、评论、标签分别编码为多个 token 向量，保留细粒度语义信息。空间端则将经纬度通过多尺度地理编码（如 Uber H3 或 Google S2 网格）映射为可学习的空间嵌入，再结合路网图神经网络生成的节点向量，使模型感知真实可达性——例如能区分“河对岸直线距离 50 米但需绕行 1 公里”和“前方 300 米但步行直达”的本质差异。时间、天气、实时拥挤度等动态上下文，以及用户长期行为序列和当前会话意图，都被编码为时序或会话向量，与查询、POI 向量一同注入交互层。

迟交互与空间感知的融合计算
重排阶段的计算采用“迟交互注意力”架构。查询和候选 POI 的 token 向量先进行压缩式交互，例如通过 MaxSim 操作计算每个查询 token 与 POI 最相关 token 的相似度并聚合，极大保留了细粒度匹配信号。随后，该语义交互向量与空间、时间、用户等上下文向量拼接，送入一个轻量级 MLP 输出最终排序分。这种方式在数百条候选上可实时完成，既超越了静态点积的浅层交互，又避免了完全交叉编码器的高延迟。训练时，损失函数直接优化列表级指标（如 LambdaRank），并重点构造空间感知的偏序对：刻意选择“语义高度相关但距离较远”和“距离近但语义无关”的样本形成四元组，通过对比学习让模型学会精准权衡相关性与可达性，而不是简单记忆“近的就是好”。

从相关性到可解释决策
向量重排带来的不仅是排序精度的提升。由于向量空间各维度可对应可学习的概念，我们能够将某条 POI 排名靠前的原因分解为“语义匹配贡献+空间便利贡献+个性化偏好贡献”，从而向用户给出自然解释，如“该咖啡厅因为静谧、提供插座且距离您步行 6 分钟，优先推荐”。复合意图也被真正激活：搜索“购物兼晚饭”时，模型能在向量交互层同时激活“购物氛围”“餐饮口味”以及“商场内是否有优质餐厅”的隐含关联，自动提升商场内含有高评价餐厅的 POI。对于新入驻零行为数据的 POI，仅依赖标题、坐标和图片的编码向量，就能与语义丰富的查询有效交互，冷启动排序质量远超依赖统计特征的传统模型。

实际落地中，某本地生活平台将 LightGBM 重排器替换为向量重排模型后，长尾语义查询的无结果率下降 17%，点击率提升 9.2%；融合路网向量后，跨区域到店转化率提升 5.8%；动态天气和拥挤度注入更让恶劣天气下室内 POI 点击占比提升超 12%。未来，生成式重排与大模型的结合将使搜索具备“琢磨再决定”的推理能力，完成从找到地点到完成体验的跨越。

维智科技Lothub平台（维智物联全域定位）已将向量重排技术产品化，提供可接入的高性能 POI 搜索服务。

查看全文

http://www.rkmt.cn/news/1442618.html