向量数据库相似度搜索算法对比

Question

请对比向量数据库中常用的相似度搜索算法：暴力搜索、IVF、HNSW、PQ。各自的原理、速度、召回率、内存占用有什么差异？。AI 面试题。Meta 面试题

小字辈 · Accepted Answer

算法原理速度召回率内存 暴力搜索全量计算O(n)100%高 IVF聚类+倒排O(sqrt(n))90-99%中 HNSW分层图O(log n)99%+高 PQ乘积量化快85-95%极低 选型：百万级以下用暴力搜索+GPU；高召回用HNSW；大容量用IVF+PQ混合。

回答