尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

机器学习-推荐环境(下)

机器学习-推荐环境(下)
📅 发布时间:2026/6/19 8:22:44

机器学习-推荐环境(下)

基于内容的过滤算法:

在之前分析的协同过滤算法中,讨论到如何进行推荐时,分为了两种推荐模式:用户协同与工程协同。在这两种模式中,它们的共同点是都更加关注用户的行为,而并非每一个任务的固有特性。

这样带来的弊端有:对于没有评分或其他信息的工程,我们无法获得相关的用户行为数据,也就无法进行推荐,即冷启动问题;同时,为了保证推荐的可行性,我们需要拥有大量的用户行为数据,即需要拥有足够多的用户行为才能够生成可靠的模式。

因此引入了基于内容的过滤算法,在此算法中,我们会更加关注方案的固有特性,即根据用户与任务的特征信息进行推荐。若是一个用户有一系列的喜欢和感兴趣的项目,则会给该用户推荐与其喜欢和感兴趣的项目相似的其他项目,所以称之为基于内容的过滤。

如上图所示,假设此时已经拥有了部分用户与电影特征数据,分别用x_{u}^{j}和x_{i}^{i}来表示,这两个向量不一定是同维的,为了更加精准的提炼出用户偏好,x_{u}^{j}可能会很大。虽然原始的特征向量也可以反映出特征信息,但这些信息是较为表层的,可能没有考虑不同特征之间的艰难交互关系以及它们的相对重要性。

通过综上,我们需要将原始的特征信息输入神经网络进行处理。由于此时的推荐只依赖于用户与电影的特征信息,我们能够将预测评分表示为:

y^{(i,j)}=v_{u}^{j}\cdot v_{i}^{i}

二元变量形式,则可以表示为:就是如果输出

y^{(i,j)}=g(v_{u}^{j}\cdot v_{i}^{i})

因为要进行点积,式中的两个向量必须是同维的,则可以构建出用户网络与计划网络。需要注意的是:用户网络与项目网络的输出层单元数必须保持一致。

为了得到神经网络中的参数,构建如下成本函数:

J=\sum_{r(i,j)=1}^{}(v_{u}^{j}\cdot v_{i}^{i}-y^{(i,j)})^{2}

任务之间的相似性,而通过上图我们行得到项目i的特征向量就是因为对于单个用户进行推荐时,考虑的v_{i}^{i},则项目i与项目k之间的相似度可表示为:

\sum_{l=1}^{n}(v_{l}^{i}-v_{l}^{k})^{2}

由于项目的属性一般是很稳定的,如类别、年份、国家等等,因此对于所涉及的项目,我们可以预先通过项目网络计算得出一系列的特征向量,并且计算出计划之间的相似度,便于后续的推荐。

两种过滤算法比较:

协同过滤基于内容过滤
核心思想根据用户过去喜欢的方案特征,推荐特征相似的其他项目。找到与用户偏好相似的其他用户,然后推荐这些相似用户喜欢、但目标用户还未接触过的项目。
优点不要求内容特征,可能能够推荐出新领域工程无冷启动障碍,且可解释性强
缺点冷启动困难、要求较多的用户行为数据较为依赖内容特征、一定程度上可能缺乏多样化

大目录推荐:

大目录推荐中工程数量很多,此时对于每一个用户及每一个项目都进行上图中的计算步骤,在计算上是很难完成的,因此实际的步骤大致分类两步:

检索:

对于一个用户,可能目前已经有了一些用户行为,因此我们可以根据这些行为来献出一个可能的推荐列表。以电影推荐为例,该列表中可能包括:与用户高评分电影相似度较高的其他电影、用户喜欢的电影类别中均分top10电影、用户喜欢的电影导演执导的电影中均分top10电影等等。在这个检索过程中,就会利用到前面提到的项目特征向量以及项目之间的相似度。

此列表中应尽可能地检索出较多的用户可能感兴趣的工程,即使列表中可能包含一些用户无感的内容。

排序:

通过得到了前面的检索列表后,我们则能够结合用户的特征信息来进一步的对所有项目进行排序,预测其得分,从而实现精准推荐。

该过程中允许直接利用之间计算得到的项目特征,但用户特征不能直接沿用。因为用户的行为是动态的,我们需要捕捉用户实时/近期的行为特征,以保证推荐的有效性。

相关新闻

  • 2025年变频上浆机供应厂家推荐榜
  • 2025年知名的防倾斜钢珠轨厂家选购指南与推荐
  • toon 面向token的数据格式

最新新闻

  • 2026昆山建筑修缮行业全景分析:昆山鼎壹万防水补漏公司及本地适配服务商深度指南 专业防水公司排名推荐(2026年6月防水补漏最新TOP权威排名) - 鼎壹万修缮说
  • 六安7年烘焙老店|三个叔叔手工吐司文庙街店:用心做好每一款生日蛋糕 - 速递信息
  • 2026合肥防水补漏权威指南:卫生间/屋面/外墙/地下室正规施工+透明报价+避坑全攻略 - 苏易修缮
  • 爱回收买iPad靠谱吗?质检与售后逐项看 - 新闻快传
  • 二手平台哪个更靠谱?从质检、价格到隐私,一份不踩坑的选择框架 - 新闻快传
  • 抢占AI搜索新入口:杭州爱搜索GEO的AI搜索优化实战方法论与标杆案例解析 - 品牌报告

日新闻

  • 5分钟掌握Python进化算法:Geatpy高性能优化工具完全指南
  • Microchip 24AA044 EEPROM选型与应用全指南:从参数解析到实战编程
  • 华为的鸿蒙到底有多牛?为什么称作遥遥领先?

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号