手写布隆过滤器Bloom Filter实现

Question

请手写一个布隆过滤器（Bloom Filter），支持add和mightContain操作。什么是布隆过滤器？它的原理是什么？为什么说布隆过滤器有假阳性（False Positive）但没有假阴性（False Negative）？如何根据预期元素数量和可接受的误判率计算位数组大小和哈希函数个数？。Java 面试题。字...

我还是少年 · Accepted Answer

原理 布隆过滤器是一个很长的二进制向量和一系列随机哈希函数，用于快速判断一个元素是否在集合中。 add：对元素进行k次哈希，将对应位设为1 mightContain：对元素进行k次哈希，检查所有位是否都为1 如果有任一位为0 → 一定不在集合中 如果所有位都为1 → 可能在集合中（假阳性） 参数计算公式 设： n = 预期元素数量 p = 期望误判率（如0.01 = 1%） m = 位数组长度（bit数） k = 哈希函数个数 m = -n * ln(p) / (ln(2)^2) k = (m/n) * ln(2) 例：n=100万, p=1% → m≈8MB, k≈7个哈希函数 手写实现 public class BloomFilter<T> { private final BitSet bits; // 位数组 private final int bitSize; // 位数组长度 private final int numHashFunctions; // 哈希函数个数 public BloomFilter(int expectedCount, double fal...

特性	说明
假阳性	可能（位可能被其他元素设置）
假阴性	不可能（如果元素已添加，其所有位必然都为1）
删除操作	不支持（不能将1重置为0）
空间效率	极高，比传统集合少几十倍内存

手写布隆过滤器Bloom Filter实现

回答

我还是少年

原理

参数计算公式

手写实现

优缺点