CodeWalk

推荐系统召回阶段方法对比

作者:我是大山 · 2026-05-30 12:55

比较推荐系统中召回阶段的主要方法:协同过滤、向量化召回和图的召回。

回答

我是大山

召回(Recall) 是从海量物品中快速筛选出候选集(通常百到千级),要求快且广。

1. 协同过滤召回

  • UserCF:找相似用户喜欢的物品
  • ItemCF:推荐与用户历史交互相似物品
  • 优点:简单可解释;缺点:冷启动

2. 向量化召回(Embedding-based)

  • 双塔模型(Two-Tower):用户塔和物品塔分别编码,内积计算相似度
  • DSSM/Youtube DNN:经典实现
  • ANN检索:Faiss/HNSW近似最近邻搜索,ms级响应百万级库
  • 优点:可融合任意特征;缺点:双塔表征能力有限

3. 图召回(Graph-based)

  • PersonalRank/Node2Vec:图上随机游走
  • EGES (Ali):Graph Embedding with Side Information
  • PinSage (Pinterest):GCN在大规模图上的工业实践
  • 优点:捕获高阶关系;缺点:在线服务复杂

工业实践:通常多路召回并行(协同+向量+热度+语义+社交),融合后输入排序阶段。

评估:召回率@K、命中率(Hit Rate)等。