散列冲突与作为特征值的散列
缘起
写这篇文章,源于这么一个问题:假设目前有一千万个URL访问记录,请统计最热门的10个查询串。(见此文)。见到这个问题的第一想法使用hash解决,没考虑hash冲突解决的问题(其实就没想比较URL,不比较URL无法判断冲突与否)。后来意识到hash解法在内存受限情况下存在致命缺陷,才有写这个blog的想法。
散列/散列函数
Hash,一般翻译做“散列”,也音译为哈希,就
http://www.cyqdata.cn/cnblogs/article-detail-39599