100台机器上海量IP如何查找出现频率 Top 100?

发布于 2021-10-09

场景题有 100 机器,每个机器的磁盘特别大,磁盘大小为 1T,但是内存大小只有 4G,现在每台机器上都产生了很多 ip 日志文件,每个文件假设有50G,那么如果计算出这 100 太机器上访问量最多的 100 ip 呢?也就是Top 100。思路其实,一开始我有往布隆过滤器那边考虑,但是布隆过滤器只

0 条评论
23 热度