什么是复杂度分析
数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”。
因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。
分别用时间复杂度和空间复杂度两个概念来描述性能问题,二者统称为复杂度。
复杂度描述的是算法执行时间(或占用空间)与数据规模的增长关系。
为什么要进行复杂度分析
和性能测试相比,复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
掌握复杂度分析,将能编写出性能更优的代码,有利于降低系统开发和维护成本。
如何进行复杂度分析
大O表示法
算法的执行时间与每行代码的执行次数成正比,用T(n) = O(f(n))表示
其中T(n)表示算法执行总时间,f(n)表示每行代码执行总次数,而n往往表示数据的规模。
特点
以时间复杂度为例,由于时间复杂度描述的是算法执行时间与数据规模的增长变化趋势,
所以常量阶、低阶以及系数实际上对这种增长趋势不产决定性影响,所以在做时间复杂度分析时忽略这些项。
复杂度分析法则
单段代码看高频:比如循环。
多段代码取最大:比如一段代码中有单循环和多重循环,那么取多重循环的复杂度。
嵌套代码求乘积:比如递归、多重循环等
多个规模求加法:比如方法有两个参数控制两个循环的次数,那么这时就取二者复杂度相加。
常用的复杂度级别
多项式阶
随着数据规模的增长,算法的执行时间和空间占用,按照多项式的比例增长。包括
O(1)(常数阶)
O(logn)(对数阶)
O(n)(线性阶)
O(nlogn)(线性对数阶)
O(n^2)(平方阶)
O(n^3)(立方阶)
非多项式阶
随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。包括,
O(2^n)(指数阶)
O(n!)(阶乘阶)
如何掌握好复杂度分析方法
复杂度分析关键在于多练,所谓孰能生巧。
复杂度分析的4个概念
最坏情况时间复杂度
代码在最理想情况下执行的时间复杂度。
最好情况时间复杂度
代码在最坏情况下执行的时间复杂度。
平均时间复杂度
用代码在所有情况下执行的次数的加权平均值表示。
均摊时间复杂度
在代码执行的所有复杂度情况中绝大部分是低级别的复杂度,个别情况是高级别复杂度且发生具有时序关系时,
可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度。
为什么要引入这4个概念
同一段代码在不同情况下时间复杂度会出现量级差异,为了更全面,更准确的描述代码的时间复杂度,所以引入这4个概念。
代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下,是不需要区别分析它们的。
如何分析平均、均摊时间复杂度?
平均时间复杂度
代码在不同情况下复杂度出现量级差别,则用代码所有可能情况下执行次数的加权平均值表示。
均摊时间复杂度
两个条件满足时使用:
1)代码在绝大多数情况下是低级别复杂度,只有极少数情况是高级别复杂度;
2)低级别和高级别复杂度出现具有时序规律。均摊结果一般都等于低级别复杂度。
思考题
分析下面add方法的代码的时间复杂度
// 全局变量,大小为 10 的数组 array,长度 len,下标 i。 int array[] = new int[10]; int len = 10; int i = 0; // 往数组中添加一个元素 void add(int element) { if (i >= len) { // 数组空间不够了 // 重新申请一个 2 倍大小的数组空间 int new_array[] = new int[len*2]; // 把原来 array 数组中的数据依次 copy 到 new_array for (int j = 0; j < len; ++j) { new_array[j] = array[j]; } // new_array 复制给 array,array 现在大小就是 2 倍 len 了 array = new_array; len = 2 * len; } // 将 element 放到下标为 i 的位置,下标 i 加一 array[i] = element; ++i; }
思考:
当i>=len时遍历array,将其成员赋值给new_array,所以时间复杂度为n,即最坏情况时间复杂度为O(n)
当i<=len时,直接插入在i位置处,所以时间复杂度为1,即最好情况时间复杂度为O(1)
而由于每次O(len)的出现都跟着len次O(1),是前后连贯的,因而将O(len)平摊到前len次上,得出平摊复杂度是O(1)