数据结构-线段树

一 什么是线段树?

线段树也叫区间树;线段树是一种二叉搜索树,它将一个区间划分成一些单元区间,每个单元区间对应线段树中的一个叶结点;

二 为什么要使用线段树?

在解释这个问题先让我们看一个经典的问题,区间染色;

假设有一面墙,长度为n,每次选择一段墙来进行染色,如下图所示:
区间染色1
首先定义一端长度为n的墙;
区间染色2

然后将4-9这个区间染成黄色;
区间染色3
在将7-15染成绿色;
区间染色4
再将1-5染成蓝色;
区间染色5
再将6-12染成红色;
最后问题来了:

1 问m次操作后我们可以看见多少种颜色?
2 m次操作后,我们可以在[i, j]区间看见多少种颜色?
不管怎样,对于这个问题来说,我们关注的是一个一个的区间,其实对于这个问题只需要两种操作就可以搞定,一个是染色操作(也就是所谓的区间更新),一个是查询操作(区间查询);但是由于我们这个是使用的数组来定义的一面墙,所以查询和更新的操作的时间复杂度都为O(n)级别的,如果我们直接使用数组进行操作系统的系统开销就太大了;因为对于这个问题我们关注点的是一个一个的区间,所以线段树在这里就有了用武之地了;

接下来我们在看一个计算机领域经典的区间查询问题
区间查询1

查询一个区间[i, j]的最大值 最小值或者该区间的数字之和;
之前我们的数据结构都是对单个的数据进行操作,显然是不适用于这这样的场景的;这里如果我们将这个问题换成对区间内的数据进行操作会是怎么样的?其实这个问题的本质就是基于区间的统计查询。

放在现在的互联网环境下也有很多这样的问题需要使用到区间查询的操作来完成?
比如:一个电商网站去年一年注册的用户中消费最高的用户是谁?消费最少的用户是谁?

其实这样的问题我们需要注意的是:我们关注的仍然是动态的情况,在这种情况下我们使用线段树会是一个很好的选择;因为动态统计的时候会伴有两个操作一个更新一个查询,如果使用数组来进行操作会极大的增加性能开销;接下来我们来对比一下线段树和数组在对这类问题方面的性能开销
性能对比

三 线段树概念详解

以上的实例我们都可以将数组直接转换成线段树,
转换过程1

这个一个数组,通过以上的实例我们不难发现在线段树中是没有添加和删除操作的,所以转换以后的线段树是这样的
线段树图示
前边也说过线段树是二分搜索树的一种,不同的地方在与线段树每个节点存储的是一个区间,我们以求区间数字之和的问题来进行解析,上图中每一个节点存储一个区间的数据,例如根节点存储的就是整个数组的数据,左右两个子节点存储的就是[0 - 3][4 - 7]这个区间的数据,以此类推;如果我们要操作这些区间数据我们只需要找到这些节点即可,以数组中[4 - 7]这个区间为例:
线段树求和图示
对于线段树来说有时候我们需要查询的区间需要进行一次合成的操作,比如说在这个实例中我们要查询区间[2 - 5]的数据,就会变成下边的情况:
线段树求和图示

我们需要先找到A[2 - 3]和A[4 - 5]这两个节点,然后对这两个节点在进行合并的操作;
所以在大数量的情况下,如果我们要操作区间数据的话,使用线段树可以很高效的解决我们的问题,而不会像使用数组那样需要先遍历一边所有的元素,这就是线段树的优势所在。

四 线段树的基础表示

1 在之前的例子中我们看到了线段树是一个二分搜索树,但是线段树不一定是一颗满的二叉树,比如说如下图所示:
当数组为10个元素的时候线段树的图示1

这是一位,我们的数组是10个元素的数组,根节点保存着10个元素的数据,根节点下边的左右子节点分别保存5个元素,但是左右子节点在往下分的话因为5不能被整除的元素就导致其下边的节点必然会出现元素个数不一致的情况,就像这样的情况:
当数组为10个元素的时候线段树的图示2
从图示中可以看出,这个线段树的叶子节点不一定是在最下边一层的,这也表示线段树不一定是满的二叉树同时也不一定是完全二叉树,但是线段树确实一颗平衡二叉树;
平衡二叉树:从根节点开始到叶子节点的深度的差值(最大深度和最小深度)不超过1,从这里我们也可以得出我们的堆也是一颗平衡二叉树,因为完全二叉树本身就是一种平衡二叉树;
  1. 平衡二叉树的好处就是不会像二分搜索树那样退化成一个链表,在平衡二叉树上进行搜索是非常高效的;
  1. 我们可以使用数组来表示平衡二叉树,因为我们可以将数组A看成是一个完全二叉树,虽然它最底层的叶子节点有一些是没有的,我们可以将这些节点看成null,这样这个平衡二叉树就会变成完全二叉树,而完全二叉树我们完全可以使用数组来表示;
  1. 那么问题就来了,如果这个区间有n个元素,我们使用数组表示需要多少个节点?
    线段树存储空间图示1

    如图所示,如果区间中有n个元素的话,我们的空间需要2n,因为上边的空间是下边空间之和,但是这有一个最坏的情况,就是我们的数组是奇数的,比如说大小为5这样的情况,那么此时的线段树存储空间就应该是下边这样的
    线段树存储空间图示2
    因为区间元素个数为n的话,我们需要2n的空间来进行存储,如果多出一个元素的话我们就需要4n的空间来进行存储,最后我们的线段树模型就应该像下边图示的那样
    线段树存储空间图示3
    我们将空的节点全部复制为null,这样就可以让它满足完全二叉树的定义;

    注意:在这里我们是浪费了一些存储空间的,由于我们定义的线段树是没有插入操作的也就是说是静态的,那么我们为了性能是完全可以牺牲掉这些空间的;

代码实现线段树基础:

package com.mufeng.segmentTree;

/**
 * Created by wb-yxk397023 on 2018/7/8.
 */
public class SegmentTree<E> {

    // 线段树使用的数组
    private E[] tree;

    private E[] data;

    public SegmentTree(E[] arr){
        data = (E[]) new Object[arr.length];

        for (int i = 0; i < arr.length; i++){
            data[i] = arr[i];
        }

        tree = (E[]) new Object[4 * arr.length];
    }

    /**
     * 获取数组长度
     * @return
     */
    public int getSize(){
        return data.length;
    }

    /**
     * 获取当前索引上的元素
     * @param index
     * @return
     */
    public E get(int index){
        if (index < 0 || index >= data.length){
            throw new IllegalArgumentException("Index is illega.");
        }
        return data[index];
    }

    /**
     * 返回完全二叉树的数组表示中,一个索引上元素的左节点索引;
     * @param index
     * @return
     */
    private int leftChild(int index){
        return 2 * index + 1;
    }

    /**
     * 返回完全二叉树的数组表示中,一个索引上元素的右节点索引;
     * @param index
     * @return
     */
    private int rightChild(int index){
        return 2 * index + 2;
    }
}

五 创建线段树

  1. 首先以求和为例我们先来看一下线段树的模型
    线段树求和模型1

    在这个图示中,我们的数组长度为10,所以线段树的根节点存储的就是10个元素的和,下边的左右子节点以及各个节点存储的都是相应区间元素的和,如果要创建这样的一个线段树我们就需要使用递归的方法进行创建;

代码实现创建过程
private Merger<E> merger;

    public SegmentTree(E[] arr, Merger<E> merger){

        this.merger = merger;

        data = (E[]) new Object[arr.length];

        for (int i = 0; i < arr.length; i++){
            data[i] = arr[i];
        }

        tree = (E[]) new Object[4 * arr.length];
        buildSegmentTree(0, 0, data.length - 1);
    }

    /**
     * 在treeIndex的位置创建表示区间[l....r]的线段树
     * @param treeIndex
     * @param l
     * @param r
     */
    private void buildSegmentTree(int treeIndex, int l, int r){
        if (l == r){
            tree[treeIndex] = data[l];
            return;
        }

        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        int mid = l + (r - l) / 2;

        buildSegmentTree(leftTreeIndex, l, mid);
        buildSegmentTree(rightTreeIndex, mid + 1, r);

        tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
    }

Merger接口的实现

package com.mufeng.segmentTree;

/**
 * Created by wb-yxk397023 on 2018/7/8.
 */
public interface Merger<E> {
    E merge(E a, E b);
}
重写toString
/**
     * 重写toString方法
     * @return
     */
    @Override
    public String toString(){
        StringBuilder res = new StringBuilder();
        res.append('[');
        for (int i = 0; i < tree.length; i++){
            if (tree[i] != null){
                res.append(tree[I]);
            }else {
                res.append("null");
            }

            if (i != tree.length - 1){
                res.append(", ");
            }
        }
        res.append(']');
        return res.toString();
    }
测试
package com.mufeng;

import com.mufeng.segmentTree.SegmentTree;

public class Main {

        public static void main(String[] args) {

            Integer[] nums = {-2, 0, 3, -5, 2, -1};
            
            SegmentTree<Integer> segTree = new SegmentTree<>(nums, (a, b) -> a + b);
            
            System.out.println(segTree);
        }
}
测试结果

六 线段树中的区间查询

基于递归我们可以很轻松的实现线段树的区间查询操作,
线段树的区间查询1

比如说基于这个线段树我们要查询区间为2-5的统计信息;
线段树的区间查询2
我们可以先从根节点进行查询;
线段树的区间查询3
根据图示我们可以得出要查询[2,5]这个区间的数据就需要查询根节点下左右两个节点的元素,左节点查询[2,3],右节点查询[4,5];
线段树的区间查询4

由于左右[2,3]和[4,5]这两个节点都有父节点,在这里我们就可以使用递归进行查询;

代码实现线段树区间的查询操作:

/**
     * 返回区间[queryL,queryR]的值
     * @param queryL
     * @param queryR
     * @return
     */
    public E query(int queryL, int queryR){

        if(queryL < 0 || queryL >= data.length ||
                queryR < 0 || queryR >= data.length || queryL > queryR)
            throw new IllegalArgumentException("Index is illegal.");

        return query(0, 0, data.length - 1, queryL, queryR);
    }

    /**
     * 线段树区间查询的核心方法
     * 在以treeID为根的线段树中[l...r]的范围里,查找[queryL...queryR]的值
     * @param treeIndex
     * @param l
     * @param r
     * @param queryL
     * @param queryR
     * @return
     */
    private E query(int treeIndex, int l, int r, int queryL, int queryR){

        if (l == queryL && r == queryR){
            return tree[treeIndex];
        }

        int mid = l + (r - l) / 2;
        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        if (queryL >= mid + 1){
            return query(rightTreeIndex, mid + 1, r, queryL, queryR);
        }else if (queryR <= mid){
            return query(leftTreeIndex, l, mid, queryL, queryR);
        }

        E legtResult = query(leftTreeIndex, l, mid, queryL, mid);
        E rightResult = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);

        return merger.merge(legtResult, rightResult);
    }

测试:

public static void main(String[] args) {

        Integer[] nums = {-2, 0, 3, -5, 2, -1};

        SegmentTree<Integer> segTree = new SegmentTree<>(nums,
                (a, b) -> a + b);
        System.out.println(segTree);

        System.out.println(segTree.query(0, 2));
        System.out.println(segTree.query(2, 5));
        System.out.println(segTree.query(0, 5));
    }
测试结果

七 线段树中的更新的操作

1⃣️ 代码实现更新操作
/**
     * 将index位置上的值更新为e
     * @param index
     * @param e
     */
    public void set(int index, E e){
        if (index < 0 || index >= data.length){
            throw new IllegalArgumentException("Index is illega.");
        }

        data[index] = e;

        set(0, 0, data.length - 1, index, e);
    }

    /**
     * 在以treeIndex为根的线段树中,更新index的值为e
     * @param treeIndex
     * @param l
     * @param r
     * @param index
     * @param e
     */
    private void set(int treeIndex, int l, int r, int index, E e){
        if (l == r){
            data[treeIndex] = e;
            return;
        }

        int mid = l + (r - l) / 2;
        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        if (index >= mid + 1){
            set(rightTreeIndex, mid + 1, r, index, e);
        }else {
            set(leftTreeIndex, l, mid, index, e);
        }

        tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
    }
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 201,924评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,781评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,813评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,264评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,273评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,383评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,800评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,482评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,673评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,497评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,545评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,240评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,802评论 3 304
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,866评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,101评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,673评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,245评论 2 341

推荐阅读更多精彩内容

  • 线段树定义: 线段树是一种二叉搜索树,又叫区间树,它将一个区间划分成一些单元区间,每个单元区间对应线段树中的一个...
    habit_learning阅读 914评论 0 0
  • 转自:http://www.cnblogs.com/TenosDoIt/p/3453089.html#b 一 概述...
    碧影江白阅读 1,539评论 1 2
  • 1 序 2016年6月25日夜,帝都,天下着大雨,拖着行李箱和同学在校门口照了最后一张合照,搬离寝室打车去了提前租...
    RichardJieChen阅读 5,069评论 0 12
  • 一 什么是优先队列? 1⃣️ 优先队列其实就是队列的一种,不过优先队列是区别于普通队列的;普通队列是一种先进先出,...
    十丈_红尘阅读 560评论 0 1
  • 望一江秋日寒水 闻一声老鸦凄鸣 饮一杯肝肠寸断 醉一场生死轮回 泣一时悲欢离合 叹一人对影独酌 别一生前缘难续 悔...
    喆喆_1abd阅读 280评论 0 0