算法-排序-下(Sorting)

7.希尔排序(Shell Sort)

◼ 1959年由唐纳德·希尔(Donald Shell)提出
◼ 希尔排序把序列看作是一个矩阵,分成 m 列,逐列进行排序
m 从某个整数逐渐减为1
当 m 为1时,整个序列将完全有序

◼ 因此,希尔排序也被称为递减增量排序(Diminishing Increment Sort)

◼ 矩阵的列数取决于步长序列(step sequence)
✓ 比如,如果步长序列为{1,5,19,41,109,...},就代表依次分成109列、41列、19列、5列、1列进行排序
✓ 不同的步长序列,执行效率也不同

希尔排序 – 实例
◼ 希尔本人给出的步长序列是 n/(2^k),比如 n为16时,步长序列是{1, 2, 4, 8}



◼ 分成8列进行排序



◼ 分成4列进行排序

◼ 分成2列进行排序

◼ 分成1列进行排序



◼ 不难看出来,从8列 变为 1列的过程中,逆序对的数量在逐渐减少
因此希尔排序底层一般使用插入排序对每一列进行排序,也很多资料认为希尔排序是插入排序的改进版

希尔排序 – 实例

◼ 假设有11个元素,步长序列是{1, 2, 5}


◼ 假设元素在第 col 列、第 row 行,步长(总列数)是 step
那么这个元素在数组中的索引是 col + row * step
比如 9 在排序前是第 2 列、第 0 行,那么它排序前的索引是 2 + 0 * 5 = 2
比如 4 在排序前是第 2 列、 1 行,那么它排序前的索引是 2 + 1 * 5 = 7
实现

@Override
    protected void sort() {
        List<Integer> stepSequence = shellSequence();
        for (Integer step : stepSequence) {
            //按照步长进行排序
            sort(step);
        }
    }
    /**
     * 分成step列进行排序
     */
    private void sort(int step) {
        // col : 第几列,column的简称
        for (int col = 0; col < step; col++) {// 对第col列进行排序
            // col、col+step、col+2*step、col+3*step
            for (int begin = col + step; begin < arr.length; begin += step) {
                int cur = begin;
                while (cur > col && cmp(cur, cur - step) < 0) {
                    swap(cur, cur - step);
                    cur -= step;
                }
            }
        }
    }

    /*
     * 获取步长数组
     */
    private List<Integer> shellSequence(){
        List<Integer> stepSequence = new ArrayList<>();
        int step = arr.length;
        while ((step = step >> 1) > 0) {
            stepSequence.add(step);
        }
        return stepSequence;
    }

◼ 最好情况是步长序列只有1,且序列几乎有序,时间复杂度为 O(n)
◼ 空间复杂度为O(1),属于不稳定排序
◼ 希尔本人给出的步长序列,最坏情况时间复杂度是 O(n^2)

◼ 目前已知的最好的步长序列,最坏情况时间复杂度是 O(n^(4/3)) ,1986年由Robert Sedgewick提出

private List<Integer> sedgewickStepSequence() {
        List<Integer> stepSequence = new LinkedList<>();
        int k = 0, step = 0;
        while (true) {
            if (k % 2 == 0) {
                int pow = (int) Math.pow(2, k >> 1);
                step = 1 + 9 * (pow * pow - pow);
            } else {
                int pow1 = (int) Math.pow(2, (k - 1) >> 1);
                int pow2 = (int) Math.pow(2, (k + 1) >> 1);
                step = 1 + 8 * pow1 * pow2 - 6 * pow2;
            }
            if (step >= arr.length) break;
            stepSequence.add(0, step);
            k++;
        }
        return stepSequence;
    }

8.计数排序(Counting Sort)

◼ 之前学习的冒泡、选择、插入、归并、快速、希尔、堆排序,都是基于比较的排序
平均时间复杂度目前最低是 O(nlogn)

◼ 计数排序、桶排序、基数排序,都不是基于比较的排序
它们是典型的用空间换时间,在某些时候,平均时间复杂度可以比 O(nlogn) 更低

◼ 计数排序于1954年由Harold H. Seward提出,适合对一定范围内的整数进行排序

◼ 计数排序的核心思想
统计每个整数在序列中出现的次数,进而推导出每个整数在有序序列中的索引

计数排序 – 最简单的实现

@Override
    protected void sort() {
        int max = arr[0];
        for (int i = 1; i < arr.length; i++) {
            if (arr[i] > max) {
                max = arr[i];
            }
        }
        //统计每个元素出现的次数,counts的长度取决于arr中最大的元素
        int[] counts = new int[1 + max];
        for (int i = 0; i < arr.length; i++) {
            //arr[i]是作为counts的索引
            counts[arr[i]] ++;
        }
        //按照顺序赋值
        int index = 0;
        for (int i = 0; i < counts.length; i++) {
            //counts[i]代表每个元素出现的次数,索引i就是arr中的元素
            while (counts[i] -- > 0) {
                arr[index ++] = i;
            }
        }
    }

◼ 这个版本的实现存在以下问题
无法对负整数进行排序
极其浪费内存空间
是个不稳定的排序

计数排序 – 改进思路




...


    @Override
    protected void sort() {
        //获取元素最大值
        int max = arr[0];
        //获取元素最小值
        int min = arr[0];
        for (int i = 1; i < arr.length; i++) {
            if (arr[i] > max) {
                max = arr[i];
            }
            if (arr[i] < min) {
                min = arr[i];
            }
        }
        // 开辟内存空间,存储次数
        int[] counts = new int[max - min + 1];
        for (int i = 0; i < arr.length; i++) {
            //arr[i]-min是作为counts的索引
            counts[arr[i] - min]++;
        }
        for (int i = 1; i < counts.length; i++) {
            counts[i] += counts[i-1];
        }
        //用于存放排序好的数组
        int[] output = new int[arr.length];
        for (int i = counts.length - 1; i >= 0; i--) {
            output[--counts[arr[i]-min]] = arr[I];
        }
        //重新赋值
        for (int i = 0; i < arr.length; i++) {
            arr[i] = output[i];
        }
    }

◼ 最好、最坏、平均时间复杂度:O(n + k)
◼ 空间复杂度:O(n + k)
◼ k 是整数的取值范围
◼ 属于稳定排序

9.基数排序(Radix Sort)

◼ 基数排序非常适合用于整数排序(尤其是非负整数),因此本课程只演示对非负整数进行基数排序
◼ 执行流程:依次对个位数、十位数、百位数、千位数、万位数...进行排序(从低位到高位)



◼ 个位数、十位数、百位数的取 范围都是固定的0~9,可以使用计数排序对它们进行排序
◼ 思考:如果先对高位排序,再对低位排序,是否可行?

    @Override
    protected void sort() {
        int max = arr[0];
        for (int i = 0; i < arr.length; i++) {
            if (arr[i] > max) {
                max = arr[i];
            }
        }
        // 个位数: array[i] / 1 % 10 = 3
        // 十位数:array[i] / 10 % 10 = 9
        // 百位数:array[i] / 100 % 10 = 5
        // 千位数:array[i] / 1000 % 10 = ...
        for (int divider = 1; divider <= max; divider *= 10) {
            countSort(divider);
        }
    }
    private void countSort(int divider) {
        // 开辟内存空间,存储次数
        int[] counts = new int[10];
        // 统计每个整数出现的次数
        for (int i = 0; i < arr.length; i++) {
            //arr[i]counts的索引
            counts[arr[i] / divider % 10]++;
        }
        for (int i = 1; i < counts.length; i++) {
            counts[i] += counts[i-1];
        }
        // 从后往前遍历元素,将它放到有序数组中的合适位置
        int[] output = new int[arr.length];
        for (int i = counts.length - 1; i >= 0; i--) {
            output[--counts[arr[i] / divider % 10]] = arr[i];
        }
        //重新赋值
        for (int i = 0; i < arr.length; i++) {
            arr[i] = output[i];
        }
    }

◼ 最好、最坏、平均时间复杂度:O(d ∗ (n + k)) ,d 是最大值的位数,k 是进制。属于稳定排序
◼ 空间复杂度:O(n + k),k 是进制

基数排序 – 另一种思路

10.桶排序(Bucket Sort)

◼ 执行流程
① 创建一定数量的桶(比如用数组、链表作为桶)
② 按照一定的规则(不同类型的数据,规则不同),将序列中的元素均匀分配到对应的桶
③ 分别对每个桶进行单独排序
④ 将所有非空桶的元素合并成有序序列



◼ 元素在桶中的索引
元素值 * 元素数量

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342