CodeWalk

向量数据库的Filtered Search与Hybrid Search

作者:孤独的心 · 2026-05-30 12:55

请解释向量数据库中的Filtered Search与Hybrid Search。Hybrid Search如何结合向量相似度+关键词BM25?RRF(倒数排名融合)如何实现?

回答

孤独的心

Filtered Search:Pre-filter(先过滤再搜,过滤严格)和Post-filter(先搜再过滤,过滤宽松)。

Hybrid Search:结合向量搜索(语义)和BM25关键词搜索(精确匹配)。

RRF(Reciprocal Rank Fusion):RRF(d) = sum(1/(k+rank_i(d))),其中k=60,融合两种搜索结果的排名。

应用场景:电商(语义搜索+价格过滤)、RAG(语义检索+实体匹配)、文档搜索(相关度+时间范围)。