zoukankan      html  css  js  c++  java
  • 【Java】 剑指offer(41) 数据流中的中位数

    本文参考自《剑指offer》一书,代码采用Java语言。

    更多:《剑指Offer》Java实现合集  

    题目 

      如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

    思路

      所谓数据流,就是不会一次性读入所有数据,只能一个一个读取,每一步都要求能计算中位数。

      将读入的数据分为两部分,一部分数字小,另一部分大。小的一部分采用大顶堆存放,大的一部分采用小顶堆存放。当总个数为偶数时,使两个堆的数目相同,则中位数=大顶堆的最大数字与小顶堆的最小数字的平均值;而总个数为奇数时,使小顶堆的个数比大顶堆多一,则中位数=小顶堆的最小数字。

      因此,插入的步骤如下:

      1.若已读取的个数为偶数(包括0)时,两个堆的数目已经相同,将新读取的数插入到小顶堆中,从而实现小顶堆的个数多一。但是,如果新读取的数字比大顶堆中最大的数字还小,就不能直接插入到小顶堆中了 ,此时必须将新数字插入到大顶堆中,而将大顶堆中的最大数字插入到小顶堆中,从而实现小顶堆的个数多一。

      2若已读取的个数为奇数时,小顶堆的个数多一,所以要将新读取数字插入到大顶堆中,此时方法与上面类似。

    测试算例 

      1.功能测试(读入奇/偶数个数字)

      2.边界值测试(读入0个、1个、2个数字)

    Java代码

    //题目:如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么
    //中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,
    //那么中位数就是所有数值排序之后中间两个数的平均值。
    
    import java.util.PriorityQueue;
    import java.util.Comparator;
    
    public class StreamMedian {
        PriorityQueue<Integer> minHeap = new PriorityQueue<Integer>(); //小顶堆,默认容量为11
        PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(11,new Comparator<Integer>(){ //大顶堆,容量11
            public int compare(Integer i1,Integer i2){
                return i2-i1;
            }
        });
        public void Insert(Integer num) {
            if(((minHeap.size()+maxHeap.size())&1)==0){//偶数时,下个数字加入小顶堆
                if(!maxHeap.isEmpty() && maxHeap.peek()>num){
                    maxHeap.offer(num);
                    num=maxHeap.poll();
                }
                minHeap.offer(num);
            }else{//奇数时,下一个数字放入大顶堆
                if(!minHeap.isEmpty() && minHeap.peek()<num){
                    minHeap.offer(num);
                    num=minHeap.poll();
                }
                maxHeap.offer(num);
            }
        }
    
        public Double GetMedian() {
            if((minHeap.size()+maxHeap.size())==0)
                throw new RuntimeException();
            double median;
            if((minHeap.size()+maxHeap.size()&1)==0){
                median=(maxHeap.peek()+minHeap.peek())/2.0;
            }else{
                median=minHeap.peek();
            }
            return median;
        }
    }
    

      

    收获

      1.最大最小堆可以用PriorityQueue实现,PriorityQueue默认是一个小顶堆,通过传入自定义的Comparator函数可以实现大顶堆:

        PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(11,new Comparator<Integer>(){ //大顶堆,容量11
            @Override
        	public int compare(Integer i1,Integer i2){
                return i2-i1; //降序排列
            }
        });
    

      PriorityQueue的常用方法有:poll(),offer(Object),size(),peek()等。

      2.平均值应该定义为double,且(a+b)/2.0 。

      3.往最大堆中插入数据时间复杂度是O(logn),获取最大数的时间复杂度是O(1)。

      4.这道题关键在于分成两个平均分配的部分,奇偶时分别插入到最大最小堆中,利用最大最小堆性质的插入方法要掌握。

    更多:《剑指Offer》Java实现合集  

      

  • 相关阅读:
    python实现快排算法,传统快排算法,数据结构
    pyaudio音频录制python
    python性能测试,请求QPS测试
    tensorflow如何切换CPU和GPU
    warmup预热学习率
    pytorch两种模型保存方式
    一个简单docker服务镜像的制作,手把手教你制作一个flask的docker容器服务镜像。
    threading的定时器模块,python,每间隔一段时间执行一次任务
    SVM简单分类的使用 sklearn机器学习
    Swoole从入门到入土(18)——WebSocket服务器[心跳ping]
  • 原文地址:https://www.cnblogs.com/yongh/p/9944993.html
Copyright © 2011-2022 走看看