数据结构前言
1.什么是数据结构?
2.什么是算法?
3.数据结构和算法的重要性
4.如何学好数据结构和算法
5.数据结构和算法书籍及资料推荐
1. 什么是数据结构?
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
2.什么是算法?
算法(Algorithm):就是定义良好的计算过程,它取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
3.数据结构和算法的重要性
算法的时间复杂度和空间复杂度
【本节目标】
1.算法效率
2.时间复杂度
3.空间复杂度
4.常见时间复杂度以及复杂度oj练习
1.算法效率
1.1如何衡量一个算法的好坏
如何衡量一个算法的好坏呢 ? 比如对于以下斐波那契数列:
long long Fib(int N)
}if(N < 3)return 1;return Fib(N-1) + Fib(N-2);
}
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
1.2算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
2.大O渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为:
O(N^2) |
● N = 10 F(N) = 100
● N = 100 F(N) = 10000
● N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况: N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
3.时间复杂度
2.1时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数(纯数学函数),它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
// 请计算一下Func1中++count语句总共执行了多少次?void Func1(int N)
{int count = 0;for (int i = 0; i < N ; ++ i){for (int j = 0; j < N ; ++ j){++count ;}}for (int k = 0; k < 2 * N ; ++ k){++count ;}int M = 10;while (M -- ){++count ;}printf("%d\n", count);
}
Func1 执行的基本操作次数:
F(N)= N^2+2*N+10 |
● N = 10 F(N) = 130
● N = 100 F(N) = 10210
● N = 1000 F(N) = 1002010
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
2.2计算大O渐进表示法的实例
O(N) |
O(M+N) |
如果 M 等于 N,则为 O(M) 或 O(N),如果 M 远远大于 N 则为 O(M),反之则为 O(N)。
O(1) |
O(1) 并不是说执行了语句一次,而是常数次。
最坏的情况:
O(n)(n = strlen(str)) |
一般情况关注的是算法的最坏运行情况。
冒泡排序法:
最好:
O(n) |
最好的情况当然是数组本来就是升序的,在经历了一次内循环后就退出了循环,一共比较了 n - 1 次
最坏:
O(N^2) |
最坏的情况是数组是降序的,每次内循环都要比较 n - 1次、n - 2次、n - 3次......到最后比较 1 次,所以一共比较 (n - 1)(n - 2)(n - 3)......3*2*1 次,
如果没有 exchange 作为判断标志,那么最好和最坏都是 O(N^2)。
一般情况关注的是算法的最坏运行情况,所以这个冒泡排序法的大O的渐进表示法是O(N^2)。
二分查找
最好的情况:一次就找到了,或常数次
O(1) |
最坏的情况:要查找的数在数组的最左端或最右端,或要查找的数大于数组最大值或小于数组最小值。每次查找数组长度(n)都要除以 2,直到区间长度为 1 时找到了或找不到,即:
n/2/2/2/2....../2/2 = 1,设查找的次数为 x ,则 2^x = n,即 x = log2(n) 。在时间复杂度的大O的渐进表示法中,以 2 为底的对数简写为logN。
O(log(n)) (n 是数组长度) |
二分查找的效率是非常高的,但它不实用,因为它要求数组是有序的。
N 1000 100W 10亿
O(N) 1000 100W 10亿
O(log2(N)) 10 20 30
O(n) |
O(2^N) |
Fib(N) 要调用 FIb(N-1) 和 Fib(N-2) ,FIb(N-1) 要调用 Fib(N-2) 和 Fib(N-3) ...... 调用函数的次数就是 1 为首项,2 为公比的等比数列的前 N 项和。
虽然上图右边有些函数会提前结束递推,但不影响总体的函数调用次数。
3.空间复杂度
时间一去不复返,不可重复利用,空间可以重复利用。
3.1空间复杂度的概念
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
3.2计算大O渐进表示法的实例
程序中只创建了 3 个变量:size_t end、int exchange、size_t i。所以这个算法的空间复杂度是:
O(1) |
在计算斐波那契数列的前 n 项时,创建了 FibArray 数组,所以这个算法的空间复杂度是:
O(n) |
每次调用 Fac 函数都要开辟函数栈帧,每开辟一个函数栈帧我们认为有常数个空间,这个算法要调用 n + 1 次函数,所以这个算法的空间复杂度是:
O(N) |
这个算法的空间复杂度是:
O(N) |
原因:为什么不是 O(N) 呢?我们得清楚函数调用的顺序: 虽然 Fib(N) 要调用 FIb(N-1) 和 Fib(N-2) ,FIb(N-1) 要调用 Fib(N-2) 和 Fib(N-3) ......,但是 Fib(N) 不是同时调用 FIb(N-1) 和 Fib(N-2) 的,是等 FIb(N-1) 返回值后再调用 Fib(N-2) 的,以此类推,FIb(N-1) 也不是同时调用 Fib(N-2) 和 Fib(N-3) 的。正确的调用顺序是:Fib(N) 先调用 FIb(N-1),FIb(N-1) 再调用 Fib(N-2) ......直到 Fib(2) 返回 1 给 Fib(3) 后,Fib(3) 再调用 Fib(1),Fib(3) 返回值给 Fib(4) 后,Fib(4) 再调用 Fib(2) ......,而 Fib(3) 调用 Fib(2) 和 Fib(1) 都是使用的同一片函数栈帧空间,所以当 Fib(N) 执行完后,一共开辟了 N 个函数栈帧空间。
4常见时间复杂度对比
一般算法常见的时间复杂度如下: