zoukankan      html  css  js  c++  java
  • leetcode 315. Count of Smaller Numbers After Self 两种思路

    说来惭愧,已经四个月没有切 leetcode 上的题目了。

    虽然工作中很少(几乎)没有用到什么高级算法,数据结构,但是我一直坚信 "任何语言都会过时,只有数据结构和算法才能永恒"。leetcode 上的题目,截止目前切了 137 道(all solutions),只写过 6 篇题解,所以我会写题解的一般都是自认为还蛮有意思或者蛮典型的题目,就比如这道题。

    题目链接:Count of Smaller Numbers After Self

    这道题很有意思,给出一个数组,返回一个新的数组,新数组每个元素表示原数组中对应位置右边比该元素小的元素个数。听不懂了吧?举个栗子:

    数组 nums = [5, 2, 6, 1]
    
    5 右边有 2 个元素比 5 小(2 和 1)
    2 右边有 1 个元素比 2 小 (1)
    6 右边有 1 个元素比 6 小(1)
    1 右边有 0 个元素比 1 小
    

    所以返回数组 [2, 1, 1, 0]

    leetcode 有一点不大好,就是不给数据大小范围,所以我相信绝大多数人会和我一样,先写个两层循环的 O(n^2) 代码,一提交,超时了,它给出超时数据,数组长度 20000+,O(n^2) 复杂度都好几亿了!

    来分析下这道题,需要求右边比该数小的数的个数,所以有一点很明确,我们需要从右往左遍历数组。还是以上面的数组举例,也就是说当我们遍历到 index=0 时,需要知道现在已经有 1, 2, 6 三个数据了,我们需要一种数据结构,能保存 1, 2, 6, 同时之后能把 5 插进去。

    首先映入脑海的是树状数组(直接把此题搞复杂了)。(不了解树状数组的可以参考我之前的文章 【前端也要学点数据结构】 神奇的树状数组 以及 【前端也要学点数据结构】神奇的树状数组的三大应用

    和改点求段很像,求右边比之小的数量,是为 "求段",求完后把该点插进入,是为 "改点"。但是我们还需要改变传统树状数组求解的思路,把数组元素大小当做下标,而不是元素的索引位置,比如说 A[1] 其实是表示 1 的数量,而 C[2] 其实是表示 1 和 2 的数量和,所以 "改点" 的时候增量都是 1,有种 "大材小用" 之感。更蛋疼的是,由于不知道数据大小,还需要进行离散化。

    目标是将 [5, 2, 6, 1] 转换成 [3, 2, 4, 1] 这样,然后再用树状数组求解。

    离散化,需要先排序,再离散,最后再排回来:

    var arr = []
      , len = nums.length;
    
    // array to object
    // 增加 index 属性,以便离散化
    for (var i = 0; i < len; i++) {
      var tmp = {};
      tmp.index = i;
      tmp.value = nums[i];
      arr.push(tmp);
    }
    
    arr.sort(function(a, b) {
      return a.value - b.value;
    });
    
    // 离散化
    var maxn = 1;
    for (var i = 0; i < len; i++) {
      if (!i) {
        arr[i].nValue = maxn;
      } else {
        arr[i].nValue = arr[i].value === arr[i - 1].value ? maxn : ++maxn;
      }
    }
    
    arr.sort(function(a, b) {
      return a.index - b.index;
    });
    

    树状数组求解:

    // 树状数组
    var ans = []
      , sum = [];
    
    for (var i = 0; i <= maxn; i++)
      sum[i] = 0;
    
    function lowbit(x) { return x & (-x); }
    
    function update(index, val) {
      for (var i = index; i <= maxn; i += lowbit(i))
        sum[i] += val;
    } 
    
    function getSum(index) {
      var ans = 0;
      for (var i = index; i; i -= lowbit(i))
        ans += sum[i];
      return ans;
    }
    
    for (var i = len - 1; i >= 0; i--) {
      var nValue = arr[i].nValue;
      ans.unshift(getSum(nValue - 1));
      update(nValue, 1);
    }
    

    树状数组部分就是简单的更新和查询了。完整代码可以参考 树状数组解法

    虽然 Accept 了,但是耗时 300ms+,仅击败了 35% 的 Javascript solutions,一看最佳答案在 200ms 左右,开始怀疑是不是有 O(n) 的解法,但是思忖良久也没有想到,想想是不是 4 次的 nlogn 耗时巨大(离散两次 sort,树状数组查询和更新各一次)。

    还是拿 [5, 2, 6, 1] 举例,当枚举到 5 时,要求 [1, 2, 6] 中小于 5 的数量,同时之后又可以把 5 插进入,维护一个二叉检索树(BST)似乎是可行的?不不不,这不是赤裸裸的二分查找吗!!!

    二分查找 [1, 2, 6] 中小于 5 的个数,查完之后把 5 塞进数组,维护数组的单调性,而且 Javascript 正好有 splice() 方法可以把一个数字插入数组。

    二分部分返回小于 target 的数量,同时也是插入 target 的位置(index):

    // binary search
    function bSearch(target, a) {
      var start = 0
        , end = a.length - 1;
    
      while(start <= end) {
        var mid = ~~((start + end) >> 1);
        if (a[mid] >= target)
          end = mid - 1;
        else if (a[mid] < target)
          start = mid + 1;
      }
    
      return start;
    }
    

    完整代码可以参考 二分查找解法

    但是遗憾的是,尽管从 4 次 nlogn 下降到了 1 次 nlongn,但是耗时不降反升了,究其原因,我觉得是 unshift() 方法和 splice() 方法的大量调用,你觉得呢?

    个人暂时没有想出 O(n) 的线性解法(可能就是没有),但是实实在在有 200ms 的 Javascript solution,难道是 BST 么?欢迎有想法的同学跟我交流探讨。

  • 相关阅读:
    使用Kubeadm安装Kubernetes【单Master节点】
    spark on yarn内存和CPU分配
    spark on yarn提交后vcore数不对
    Win7_64位MyEclipse2015提交mapreduce到CDH5.10.0任务失败
    我对Map端spill的理解
    mapreduce on yarn简单内存分配解释
    namenode无法启动
    全栈编程@luboke.com原创go语言体系课
    基于go语言结合微信小程序开发的微商城系统
    微信小程序登陆流程图时序图
  • 原文地址:https://www.cnblogs.com/lessfish/p/5107442.html
Copyright © 2011-2022 走看看