数据结构与算法笔记day09:排序(归并排序|快速排序)

        本节讲两个时间复杂度为O(nlogn)的排序算法:归并排序快速排序,它们都用到了分治的思想。分治,顾名思义,就是分而治之,将一个大问题分解成小的子问题来解决,小的子问题解决了,大问题也就解决了。

        这两种排序算法适合大规模的数据排序,比上节课讲的三种排序方法要更常用。

    1归并排序

        归并排序的核心思想是将要排序的数组从中间分成前后两部分,然后对两部分分别排序,再将排好序的两部分合并在一起,这样整个数组就都有序了。如下图所示:

        分治思想和我们前面讲的递归很像,其实,分治算法一般都是用递归来实现的。分治是一种解决问题的处理思想,递归是一种编程技巧。(后面再展开来讲分治算法的思想,这节课还是以排序算法为主)

        如何用递归代码来实现归并排序呢?

        1)写出递推公式:merge_sort(p...r)=merge(merge_sort(p...q),merge_sort(q+1...r))

        2)找到终止条件:p>=r

        3)将递推公式翻译成递归代码。

        Merge函数的实现思路:

        代码如下:

        运行结果:

        总结一下:

        第一,归并排序是稳定的排序算法。归并排序稳不稳定关键要看Merge函数,在合并的过程中,如果 A[p…q] 和 A[q+1…r] 之间有值相同的元素,那我们可以像伪代码中那样,先把 A[p…q] 中的元素放入tmp数组,这样就保证了值相同的元素,在合并前后的先后顺序不变。

        第二,归并排序的时间复杂度是O(nlogn)。一个问题a分解为多个子问题b和c,如果我们定义求解a问题的时间是T(a),求解b、c问题的时间是T(b)和T(c),那我们就可以得到这样的递推公式:T(a)=T(b)+T(c)+K,其中K等于将两个子问题b、c的结果合并成问题a的结果所消耗的时间。

        我们假设对n个元素进行归并排序需要的时间是 T(n),那分解成两个子数组排序的时间都是 T(n/2)。我们知道,merge() 函数合并两个有序子数组的时间复杂度是 O(n)。所以,套用前面的公式,归并排序的时间复杂度的计算公式就是:

        我们再进一步分解一下计算过程。

        通过这样一步一步分解推导,我们可以得到 T(n) = 2^kT(n/2^k)+kn。当 T(n/2^k)=T(1) 时,也就是 n/2^k=1,我们得到 k=log2n 。我们将k 值代入上面的公式,得到 T(n)=Cn+nlog2n。如果我们用大 O 标记法来表示的话,T(n) 就等于 O(nlogn)。所以归并排序的时间复杂度是 O(nlogn)。

        归并排序的执行效率与要排序的原始数组的有序成都无关,所以它的时间复杂度是非常稳定的,不管最好情况、最坏情况、还是平均情况,时间复杂度都是O(nlogn)。

        第三,归并排序的空间复杂度是O(n)。归并排序有一个致命的弱点,就是它不是原地排序算法。它在合并两个有序数组为一个有序数组时,需要借助额外的存储空间,但是,尽管每次合并操作都需要申请额外的存储空间,但是在合并完成之后,临时开辟的内存空间就被释放掉了,在任意时刻,CPU只会有一个函数在执行,也就是只会有一个临时的内存空间在使用,而这个临时内存空间最大也不会超过n,所以空间复杂度是O(n)。

    2快速排序

        快排的思想是这样的:如果要排序数组中下标从p到r之间的一组数据,我们选择p到r之间的任意一个数据作为pivot(分区点),我们遍历p到r之间的数据,将小于pivot的放在左边,将大于pivot的放在右边,将pivot放在中间。这样数组p到r之间的数据就被分成了三个部分,前面p到q-1之间都是小于pivot的,中间是pivot,后面的q+1到r之间是大于pivot的,如下图所示:

        根据分治、递归的处理思想,我们可以用递归排序下表从p到q-1之间的数据和下标从q+1到r之间的数据,直到区间缩小为1,就说明所有的数据都有序了。

        1)递推公式:quick_sort(p…r) = quick_sort(p…q-1) + quick_sort(q+1, r)

        2)终止条件:p >= r

        代码:

        其中的partition()分区函数就是随机选择一个元素作为pivot(一般情况下,可以选择p到r区间的最后一个元素),然后对A[p...r]分区,函数返回pivot的下标。

        如果我们不考虑空间消耗的话,partition() 分区函数可以写得非常简单。我们申请两个临时数组 X 和 Y,遍历 A[p…r],将小于 pivot 的元素都拷贝到临时数组 X,将大于 pivot 的元素都拷贝到临时数组 Y,最后再将数组X 和数组 Y 中数据顺序拷贝到 A[p…r]。

        但是,如果按照这种思路实现的话,partition() 函数就需要很多额外的内存空间,所以快排就不是原地排序算法了。如果我们希望快排是原地排序算法,那它的空间复杂度得是 O(1),那 partition() 分区函数就不能占用太多额外的内存空间,我们就需要在 A[p…r] 的原地完成分区操作。

        原地分区函数的实现思路的伪代码,也就是我们最后的实现思路:

        图片版的思路:

        总结一下:

        第一,快速排序是一种原地排序算法。

        第二,快速排序是一种不稳定的排序算法。

        第三,快速排序的时间复杂度是O(nlogn)。如果每次分区操作,都能正好把数组分成大小接近相等的两个小区间,那么快排的时间复杂度递推求解公式跟归并是相同的,但是这种情况是很难实现的。举一个极端情况的例子,如果数组中的数据原来已经是有序的了,比如,1,3,5,7,9,如果我们每次都选择最后一个元素作为pivot,那么每次分区得到的两个区间都是不均等的,我们需要进行大约n次分区操作,才能完成整个快排的过程。每次分区我们平均要扫描大约n/2个元素,这种情况下快排的时间复杂度就退化成了O(n^2)。但是,快排在大部分情况下的时间复杂度都可以做到O(nlogn),只有在极端情况下才会退化成O(n^2)。

    3归并排序和快速排序有什么区别?

        可以发现,归并排序的处理过程是由下到上的,先处理子问题,然后再合并。而快排的处理过程是由上到下的,先分区,再处理子问题。归并虽然是稳定的、时间复杂度也和快排相同,但是它不是原地排序算法,因为它的合并函数无法在原地执行。而快排可以实现原地排序,解决了归并排序占用太多内存的问题。

        (遗留了一个怎样找到一个数组中第K大元素的问题,下次复习的时候解决~)

    内容小结

        归并排序和快速排序是两种稍微复杂的排序算法,它们用的都是分治的思想,代码都是通过递归来实现,过程非常相似。理解归并排序的重点是理解递推公式和merge()合并函数,理解快排的重点是理解递推公式和partition()分区函数。归并排序在任何情况下时间复杂度都比较稳定,但它不是原地排序算法,空间复杂度比较高,所以没有快排应用广泛。快排虽然最快情况下的时间复杂度比较高,但是平均情况下时间复杂度和归并排序一样,而且它退化到最坏情况时间复杂度的概率非常小,并且有避免的办法。

        戳这里查看源代码。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容