Skip to content

Latest commit

 

History

History
7 lines (6 loc) · 822 Bytes

布隆过滤器.md

File metadata and controls

7 lines (6 loc) · 822 Bytes

布隆过滤器原理

  • 布隆过滤器可以检查值是 “可能在集合中” 还是 “绝对不在集合中”。
  • 布隆过滤器(Bloom Filter)本质上是由长度为 m 的位向量或位列表(仅包含 0 或 1 位值的列表)组成,最初所有的值均设置为 0
  • 为了将数据项添加到布隆过滤器中,我们会提供 K 个不同的哈希函数,并将结果位置上对应位的值置为 “1”

总结:当我们搜索一个值的时候,若该值经过 K 个哈希函数运算后的任何一个索引位为 ”0“,那么该值肯定不在集合中。但如果所有哈希索引值均为 ”1“,则只能说该搜索的值可能存在集合中。 5分钟搞懂布隆过滤器,亿级数据过滤算法你值得拥有!