1. 什么是复杂度分析?
- 数据结构和算法本身解决的是“快”和“省”的问题,即如何让代码运行得更快,如何让代码更省存储空间。
- 执行效率是算法一个非常重要的考量指标。使用执行时间和占用空间两个维度来评估数据结构和算法的性能。
- 分别用时间复杂度和空间复杂度两个概念来描述性能问题,二者统称为复杂度。
- 复杂度描述的是算法执行时间(或占用空间)与数据规模的增长关系。
2. 为什么要进行复杂度分析?
- 和性能测试相比,复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
- 掌握复杂度分析,将能编写出性能更优的代码,有利于降低系统开发和维护成本。
3. 如何进行复杂度分析?
3.1. 大O表示法
- 来源
算法的执行时间与每行代码的执行次数成正比,用T(n) = O(f(n))
表示,其中T(n)
表示算法执行总时间,f(n)
表示每行代码执行总次数,而n
往往表示数据的规模。 - 特点
以时间复杂度为例,由于时间复杂度描述的是算法执行时间与数据规模的增长变化趋势,所以常量阶、低阶以及系数实际上对这种增长趋势不产决定性影响,所以在做时间复杂度分析时忽略这些项。
3.2. 复杂度分析法则
a)单段代码看高频:比如循环。
b)多段代码取最大:比如一段代码中有单循环和多重循环,那么取多重循环的复杂度。
c)嵌套代码求乘积:比如递归、多重循环等
d)多个规模求加法:比如方法有两个参数控制两个循环的次数,那么这时就取二者复杂度相加。
4. 常用的复杂度级别?
- 多项式阶:随着数据规模的增长,算法的执行时间和空间占用,按照多项式的比例增长。包括,
O(1)
(常数阶)、O(logn)
(对数阶)、O(n)
(线性阶)、O(nlogn)
(线性对数阶)、O(n^2)
(平方阶)、O(n^3)
(立方阶) - 非多项式阶:随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。包括,
O(2^n)
(指数阶)、O(n!)
(阶乘阶)
5. 复杂度分析的4个概念
- 最坏情况时间复杂度:代码在最理想情况下执行的时间复杂度。
- 最好情况时间复杂度:代码在最坏情况下执行的时间复杂度。
- 平均时间复杂度:用代码在所有情况下执行的次数的加权平均值表示。
- 均摊时间复杂度:在代码执行的所有复杂度情况中绝大部分是低级别的复杂度,个别情况是高级别复杂度且发生具有时序关系时,可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度。
6. 为什么要引入这4个概念?
- 同一段代码在不同情况下时间复杂度会出现量级差异,为了更全面,更准确的描述代码的时间复杂度,所以引入这4个概念。
- 代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下,是不需要区别分析它们的。
7. 如何分析平均、均摊时间复杂度?
7.1. 平均时间复杂度
代码在不同情况下复杂度出现量级差别,则用代码所有可能情况下执行次数的加权平均值表示。
7.2. 均摊时间复杂度
两个条件满足时使用:
- 代码在绝大多数情况下是低级别复杂度,只有极少数情况是高级别复杂度;
- 低级别和高级别复杂度出现具有时序规律,均摊结果一般都等于低级别复杂度。
8. 如何掌握好复杂度分析方法?
关键在于多练,所谓孰能生巧。
03-复杂度分析(上):如何分析、统计算法的执行效率和资源消耗?
04-复杂度分析(下):浅析最好、最坏、平均、均摊时间复杂度