如何用MySQL快速实现一个推荐算法

网友投稿 390 2023-11-17

如何用MySQL快速实现一个推荐算法

本文小编为大家详细介绍“如何用MySQL快速实现一个推荐算法”,内容详细,步骤清晰,细节处理妥当,希望这篇“如何用MySQL快速实现一个推荐算法”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

如何用MySQL快速实现一个推荐算法

使用MySQL实现一个简单的推荐算法

推荐算法是会经常遇到的技术。主要解决的是问题是:如果你喜欢书 A,那么你可能会喜欢书 B。

本文我们使用 MySQL ,基于数据统计,拆解实现了一个简单的推荐算法。

首先,创建一个 用户喜欢的书数据表,所表示的是 user_id 喜欢 book_id。

CREATE TABLEuser_likes (     user_idINT NOT NULL,     book_id VARCHAR(10NOT NULL,     PRIMARY KEY(user_id,book_id),UNIQUE KEY book_id (book_id, user_id) ); CREATE TABLEuser_likes_similar (     user_idINT NOT NULL,     liked_user_id INT NOT NULL,     rank INT NOT NULL,     KEYbook_id (user_id, liked_user_id) );

插入 4 条测试数据

INSERT INTO user_likes VALUES (1A), (1B), (1C); INSERT INTO user_likes VALUES (2A), (2B), (2C), (2,D); INSERT INTO user_likes VALUES (3X), (3Y), (3C), (3,Z); INSERT INTO user_likes VALUES (4,W), (4Q), (4C), (4,Z);

代表的含义为:用户 1 喜欢 A、B、C,用户 2 喜欢 A、B、C、D,用户 3 喜欢 X、Y、C、Z,用户 4 喜欢 W、Q、C、Z。

以为用户 1 计算推荐书籍为例,我们需要计算用户 1 和其他用户的相似度,然后根据相似度排序。

清空相似度数据表

DELETE FROM user_likes_similar WHERE user_id = 1;

计算用户相似度数据表

INSERT INTO user_likes_similar SELECT 1 AS user_id, similar.user_id AS liked_user_id, COUNT(*) AS rank     FROMuser_likes targetJOIN user_likes similar ON target.book_id= similar.book_id ANDtarget.user_id != similar.user_idWHERE target.user_id = 1     GROUP BY similar.user_id ;

可以看到查找到的相似度结果为

user_id, liked_user_id, rank 1, 2, 2 1, 3, 1 1, 4, 1

然后根据相似度排序,取前 10 个,就是推荐的书籍了。

SELECT similar.book_id, SUM(user_likes_similar.rank) AS total_rank     FROMuser_likes_similarJOIN user_likes similar ON user_likes_similar.liked_user_id = similar.user_id     LEFT JOINuser_likes targetON target.user_id = 1 AND target.book_id = similar.book_id     WHEREuser_likes_similar.user_id =1 AND target.book_id IS NULL     GROUP BY similar.book_id     ORDER BY total_rank desc     LIMIT 10;

读到这里,这篇“如何用MySQL快速实现一个推荐算法”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注行业资讯频道。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:mysql的事务隔离级别是什么
下一篇:MySQL索引设计原则有哪些
相关文章