协同过滤
【总结】
- 协同过滤
- =Collaborative Filtering=CF
- 是什么
- 一种算法
- 推荐算法中最经典的类型
- 要点
- 在线的协同
- 过在线数据找到用户可能喜欢的物品
- 在线数据:往往是大数据
- 离线的过滤
- 过滤掉一些不值得推荐的数据
- 举例
- 推荐值评分低的数据
- 推荐值高但是用户已经购买的数据
- 模型
- 输入
- m个物品,m个用户的数据
- 只有部分用户和部分数据之间是有评分数据
- 其它部分评分是空白
- 处理逻辑
- 用已有的部分稀疏数据
- 预测那些空白的物品和数据之间的评分关系
- 输出
- 找到最高评分的物品推荐给用户
- 分类
- User-based CF=基于用户的协同过滤
- 主要逻辑
- 利用用户和用户之间的相似度
- 即 品味相近
- 找出相似用户喜欢的物品
- =预测目标用户对对应物品的评分
- 找到评分最高的若干个物品推荐给用户
- Item-based CF=基于物品的协同过滤
- 主要逻辑
- 利用物品和物品之间的相似度
- 找到目标用户对某些物品的评分
- 可以对相似度高的类似物品进行预测
- 将评分最高的若干个相似物品推荐给用户
- 举例
- 你在网上买了一本机器学习相关的书
- 网站马上会推荐一堆机器学习、大数据相关的书给你
- Model-based=基于模型的协同过滤