第2章 算法
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
算法定义中,提到了指令,指令能被人或机器等计算装置执行。它可以是计算机指令,也可以是我们平时的语言文字。
为了解决某个或某类问题,需要把指令表示成一定的操作序列,操作序列包括一组操作,每一个操作都完成特定的功能,这就是算法了。
2.1 算法的特性
算法具有五个基本特性:输入、输出、有穷性、确定性和可行性。
2.1.1 输入输出
算法具有零个或多个输入。对于绝大多数算法来说,输入参数都是必要的,但对于个别情况,如打印“hello world!”这样的代码,不需要任何输入参数,因此算法的输入可以是零个。
算法至少有一个或多个输出。算法是一定需要输出的,输出的形式可以是打印输出,也可以是返回一个或多个值等。
2.1.2 有穷性
有穷性:指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
现实中经常会写出死循环的代码,这就是不满足有穷性。
2.1.3 确定性
确定性:算法的每一步骤都具有确定的含义,不会出现二义性。
算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果。算法的每个步骤被精确定义而无歧义。
2.1.4 可行性
可行性:算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成。
可行性意味着算法可以转换为程序上机运行,并得到正确的结果。尽管在目前计算机界也存在那种没有实现的极为复杂的算法,不是说理论上不能实现,而是因为过于复杂,当前的编程方法、工具和大脑限制了这个工作。
2.2 算法设计的要求
2.2.1 正确性
正确性:算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案。
2.2.2 可读性
可读性:算法设计的另一目的是为了便于阅读、理解和交流。
2.2.3 健壮性
健壮性:当输入数据不合法时,算法也能做出相关处理,而不是产生异常或莫名其妙的结果。
2.2.4 时间效率高和存储量低
好的算法还应该具备时间效率高和存储量低的特点。
时间效率指的是算法的执行时间,对于同一个问题,如果有多个算法能够解决,执行时间短的算法效率高,执行时间长的效率低。
存储量需求指的是算法在执行过程中需要的最大存储空间,主要指算法程序运行时所占用的内存或外部硬盘存储空间。
设计算法应该尽量满足时间效率高和存储量低的需求。
2.3 算法效率的度量方法
2.3.1 事后统计
这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。
2.3.2 事前分析估算
在分析一个算法的运行时间时,最重要的是把基本操作的数量与输入规模关联起来,即基本操作的数量必须表示成输入规模的函数。
2.4 函数的渐近增长
2.5 算法时间的复杂度
2.6 常见的时间复杂度
2.7 最坏情况和平均情况
2.8 算法空间复杂度