zoukankan      html  css  js  c++  java
  • 数据存储小算法

    记录一个问题: 有一个10G大小的文件,文件内为一行一个的整数,给定可使用内存为2G.要求统计出现次数最多的数字。

    1、流式数据处理(这块后面单独写吧,埋坑....)

    2、分文件处理

          读入部分文件,对数值模10.取值相同放入一个文件。然后处理10个文件。统计出现次数最多的。

          我认为上面这种方案可以解决一种情况。就是文件数值不重复。或者重复较少的情况

    假设一种极端情况。文件内容全部取模值全部相同。或者超过2G就不在适用上面的方法了。而更适合将相同的数字放入同一个文件。

         情况不同解决方案也不尽相同。没有银弹
    ---------------------
    作者:乔帆
    来源:CSDN
    原文:https://blog.csdn.net/weixin_40596063/article/details/82895458
    版权声明:本文为博主原创文章,转载请附上博文链接!

  • 相关阅读:
    51Nod1740 蜂巢迷宫
    51Nod1279 扔盘子
    51Nod1095 Anigram单词
    51Nod1094 和为k的连续区间
    51Nod1072 威佐夫游戏
    PHP 图片处理
    ubuntu 安装 ftp
    linux下ab网站压力测试命令
    iptables FOr linux
    discuz 个性化时间函数
  • 原文地址:https://www.cnblogs.com/stone531/p/10992547.html
Copyright © 2011-2022 走看看