推荐系统召回阶段方法对比
比较推荐系统中召回阶段的主要方法:协同过滤、向量化召回和图的召回。
回答
我是大山
召回(Recall) 是从海量物品中快速筛选出候选集(通常百到千级),要求快且广。
1. 协同过滤召回:
- UserCF:找相似用户喜欢的物品
- ItemCF:推荐与用户历史交互相似物品
- 优点:简单可解释;缺点:冷启动
2. 向量化召回(Embedding-based):
- 双塔模型(Two-Tower):用户塔和物品塔分别编码,内积计算相似度
- DSSM/Youtube DNN:经典实现
- ANN检索:Faiss/HNSW近似最近邻搜索,ms级响应百万级库
- 优点:可融合任意特征;缺点:双塔表征能力有限
3. 图召回(Graph-based):
- PersonalRank/Node2Vec:图上随机游走
- EGES (Ali):Graph Embedding with Side Information
- PinSage (Pinterest):GCN在大规模图上的工业实践
- 优点:捕获高阶关系;缺点:在线服务复杂
工业实践:通常多路召回并行(协同+向量+热度+语义+社交),融合后输入排序阶段。
评估:召回率@K、命中率(Hit Rate)等。