基于物品做推荐系统的方法

来源：cnblogs　　作者：冬瓜蛋　　时间：2019/3/26 8:29:45　　对本文有异议

一、内容协同过滤之物品协同过滤

协同过滤算法是指：利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人通过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的目的进而帮助别人筛选信息。

物品协同过滤是指协同过滤算法在进行筛选的时候是以物品之间的相似度作为衡量，如图1：

电影名	R	Toy	RxToy	Jumanji	RxJumanji	Grumpier	RxGrumpier
Waiting	4.7	0.171	0.808	0.212	0.996	0.077	0.362
Father	2.7	0.009	0.024	0.102	0.275	0.085	0.230
Heat	1.0	0.165	0.165	0.7	0.7	0.203	0.023
总计		0.345	0.997	1.014	1.971	0.365	0.615
归一化			2.890		1.944		1.685

图1

第二、三、四行每一列的意思分别为：电影名字《Waiting》、某用户给《Waiting》的打分、《Waiting》与《Toy》之间的相似度(计算方法见第四节)、《Waiting》的打分乘以《Waiting》与《Toy》之间的相似度…以此类推。

第四行给出了相似度累计值和Rx电影名的累计值。

第五行使用Rx电影名的累计值除以相似度累计值。

根据第五行的计算，我们基于推荐影片的评分分别为Toy：2.890，Jumanji：1.944，Grumpier：1.685。由此可见，《Toy》应该优先推荐给该用户。

二、皮尔逊相关度

皮尔逊相关系数广泛用于度量两个变量之间的相关程度，其值介于-1与1之间。

公式1

三、欧几里得距离

欧几里得距离或欧几里得度量是欧几里得空间中两点间“普通”（即直线）距离。

公式2

四、相似度矩阵

衡量物品之间的相似度，这里我们使用用户打分维度作为相似度特征，如图2：

电影名	用户1打分	用户2打分	用户3打分
Waiting	1	2	3
Father	3	2	1
Heat	1	2.5	3

图2

可以使用皮尔逊相关度或者欧几里得距离计算：《Waiting》与《Heat》属于同一类型，与《Father》属于不同类型。

五、系统构造基本流程

1、构造用户打分数据，例如：ID为87的用户给部分电影的打分如下;

2、根据用户打分数据构造物品相似度矩阵；根据相似度矩阵构造用户推荐列表，例如给ID为87的用户推荐的影片如下：

六、测试代码、测试数据、参考资料

https://github.com/dongguadan/recommender-system/tree/master/Item-Based-Filter

《集体智慧编程》

原文链接：http://www.cnblogs.com/dongguadan/p/10583351.html

友情链接：直通硅谷　点职佳　北美留学生论坛

如何注册chatgpt，如何使用chatgpt，以及chatgpt无法访问的原因。chatgpt问题总结。

并行Louvain社区检测算法 - orion-orion

《Deep Learning》(深度学习)中文版PDF免费下载

斗地主AI出牌助手--在线调用斗地主AI，实现自动斗地主

ChatGPT 1.0.0安卓分析，仅限国内分享

ChatGPT3.5使用体验

0902-用GAN生成动漫头像

记录：tf.saved_model 模块的简单使用（TensorFlow 模型存储与恢复）

ML.NET教程之客户细分(聚类问题)

人工智能基础推荐文章

【LLM训练系列】NanoGPT源码详解和中文GPT训练实践

解密Prompt系列36. Prompt结构化编写和最优化算法UNIPROMPT

RealNet：从数据生成到模型训练的最新工业异常检测 | CVPR 2024

再探GraphRAG：如何提升LLM总结能力？

AI 大模型时代呼唤新一代基础设施，DataOps 2.0和调度编排愈发重要

QWen2-72B-Instruct模型安装部署过程

AI编程助手那些事儿

FP分数规划在无线通信中的应用

ambari+ bigtop 编译、打包、部署步骤总览

ComfyUI插件：ComfyUI Impact 节点（二）

人工智能基础热门文章

人工智能基础推荐文章