协同过滤（Collaborative Filtering）

协同过滤（Collaborative Filtering）

这是推荐系统的核心方法之一，专门解决“信息过载”和“个性化匹配”问题。在数字营销中，它用于向用户自动推荐内容、商品或广告，从而提升转化率和客单价。

下面我们从零开始，逐步拆解。

想象你去一家餐厅。你会怎么点菜？

协同过滤就是方式B：不分析物品本身属性，只分析用户与物品之间的互动行为（点击、购买、评分），找到“行为相似的人”或“经常一起出现的物品”，然后做推荐。

1. 用户-based 协同过滤

步骤：
1. 找出与当前用户“行为相似度最高”的K个其他用户（称为“邻居”）。
2. 看这些邻居喜欢过什么物品，且当前用户还没见过。
3. 把邻居们最喜欢的物品推荐给当前用户。
营销例子：用户A买了钓鱼竿和帐篷。系统发现用户B也买了钓鱼竿和帐篷，还买了防潮垫。于是把防潮垫推荐给用户A。
适用场景：用户量较小、用户偏好相对稳定的平台（如早期豆瓣）。

2. 物品-based 协同过滤

步骤：
1. 计算物品之间的“共现相似度”——即“购买了物品X的用户，有多大比例也购买了物品Y”。
2. 当用户刚对一个物品（如手机）表现出兴趣，就找到与手机最相似的几个物品（如手机壳、贴膜）。
3. 推荐这些相似物品。
营销例子：亚马逊“购买此商品的顾客也购买了……”就是典型。用户看了一双跑鞋，系统推荐同款跑鞋的不同配色、或相关运动袜。
适用场景：用户量大、物品数量相对稳定（电商、视频网站）。

无论是找相似用户还是相似物品，都需要量化“相似”。最常用的是余弦相似度。

假设我们用向量表示用户对物品的评分：

余弦相似度公式：
similarity = cos(θ) = (A·B) / (||A|| × ||B||)

数字营销中，你可以把“评分”换成“是否点击”（0/1）、“停留时长”、“加购次数”等标准化后的数值。

协同过滤完全依赖历史行为数据，所以会遇到：

新用户冷启动：新用户没有任何点击/购买记录，找不到邻居，无法推荐。
→ 营销解法：先让他完成“兴趣问卷”或引导浏览几个品类（产生初始行为），或采用“非个性化推荐”（热门榜）。
新物品冷启动：一个新商品上架，没人互动过，不会被推荐。
→ 营销解法：结合内容过滤（分析商品标题、描述的关键词）或人为打标签，直到积累足够行为。
数据稀疏：一个电商有100万用户和10万商品，平均每个用户只买过5件商品。用户-物品矩阵99.995%是空的，很难找到相似用户。
→ 营销解法：优先使用物品-based（因为物品互动相对集中，热门物品共现统计更可靠），或用矩阵分解技术（如SVD，非本词条）。

假设你运营一个服装独立站，想用协同过滤提升交叉销售：

步骤1：埋点收集行为
记录每个用户最近30天的：

步骤2：构建行为矩阵
将行为加权：purchase=3分, add_to_cart=1分, view=0.5分。得到用户-物品分值矩阵。

步骤3：物品-based计算
例如发现：浏览“白色亚麻衬衫”的用户中，有62%也浏览/购买了“卡其色短裤”。相似度=0.62。

步骤4：实时触发
当用户正在看“白色亚麻衬衫”的详情页时，推荐位展示“卡其色短裤”，并附文案：“看过此衬衫的顾客也喜欢短裤”。

步骤5：A/B测试验证
对照组：展示热销款推荐。实验组：展示协同过滤推荐。观测指标：加购率、关联购买率。通常协同过滤可将交叉销售提升10-30%。

你已经掌握了从思想、分支、数学原理、缺陷到实战落地的完整知识链。