JAVA concurrency -- 阻塞队列ArrayBlockingQueue源码详解

概述

ArrayBlockingQueue顾名思义,使用数组实现的阻塞队列。今天我们就来详细讲述下他的代码实现

阻塞队列

什么是阻塞队列?

阻塞队列是一种特殊的队列,使用场景为并发环境下。在某种情况下(当线程无法获取锁的时候)线程会被挂起并且在队列中等待,如果条件具备(锁被释放)那么就会唤醒挂起的线程。

通俗点来讲的话,阻塞队列类似于理发店的等待区,当没有理发师空闲的时候,客人会在等待区等待,一旦有了空闲,就会有人自动递补。

类的继承关系

ArrayBlockingQueue继承关系.png

ArrayBlockingQueue继承了抽象队列,并且实现了阻塞队列,因此它具备队列的所有基本特性。

基本实现原理

ArrayBlockingQueue的实现是基于ReentrantLock以及AQS内部实现的锁机制以及Condition机制。
ArrayBlockingQueue内部声明了两个Condition变量,一个叫notEmpty,一个叫notFull,当有数据加入队列时尝试唤醒notEmpty,当有数据移除队列时则唤醒notFull,从而实现一个类似于生产者消费者模型的机制。

源码分析

类成员变量

    // 队列的存储对象数组
    final Object[] items;

    // 下一个取出的序号
    int takeIndex;

    // 下一个放入队列的序号
    int putIndex;

    // 队列中的元素数目
    int count;

    // 锁以及用来控制队列的两个条件变量
    final ReentrantLock lock;

    private final Condition notEmpty;

    private final Condition notFull;

    transient Itrs itrs = null;

构造函数

    public ArrayBlockingQueue(int capacity) {
        this(capacity, false);
    }
    
    // 通用的构造函数,以容量和是否公平锁为参数,余下两个构造函数均调用此函数
    public ArrayBlockingQueue(int capacity, boolean fair) {
        if (capacity <= 0)
            throw new IllegalArgumentException();
        this.items = new Object[capacity];
        lock = new ReentrantLock(fair);
        notEmpty = lock.newCondition();
        notFull =  lock.newCondition();
    }

    public ArrayBlockingQueue(int capacity, boolean fair,
                              Collection<? extends E> c) {
        // 调用构造函数
        this(capacity, fair);

        // 为阻塞队列初始化数据(此操作需要上锁)
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            int i = 0;
            try {
                // 将集合中的数据存放到数组中并且进行判空操作
                for (E e : c) {
                    checkNotNull(e);
                    items[i++] = e;
                }
            } catch (ArrayIndexOutOfBoundsException ex) {
                throw new IllegalArgumentException();
            }
            // 修改count和putIndex的值
            count = i;
            putIndex = (i == capacity) ? 0 : i;
        } finally {
            lock.unlock();
        }
    }

这里有一点疑问,这里明明是构造函数,是类初始化的地方,照理来说不会产生竞争,为什么要进行加锁操作呢?此处原本有一句原版的注释 Lock only for visibility, not mutual exclusion 锁是为了可见性而不是互斥。这句话怎么理解呢?我们仔细观察代码,发现当我们把集合中的数据全部插入队列中之后,我们会修改相应的count以及putIndex的数值,但是如果我们没有加锁,那么在集合插入完成前count以及putIndex没有完成初始化操作的时候如果有其他线程进行了插入等操作的话,会造成数据同步问题从而使得数据不准确,因此这里的锁是必要的。

队列操作

基础队列操作enqueue和dequeue

    // 队列的插入操作
    private void enqueue(E x) {
        // 本地声明一个item数组的引用
        final Object[] items = this.items;
        // 将元素放入数组中
        items[putIndex] = x;
        // 如果此时已经到了数组的末尾了,将putIndex重置为0
        if (++putIndex == items.length)
            putIndex = 0;
        // 元素数目加1
        count++;
        // 发出通知告诉所有取数据的线程可以取数据
        notEmpty.signal();
    }

    // 队列的移除操作
    private E dequeue() {
        final Object[] items = this.items;
        @SuppressWarnings("unchecked")
        // 找到要移除的数据置空
        E x = (E) items[takeIndex];
        items[takeIndex] = null;
        // 如果此时已经到了数组的末尾了,将takeIndex重置为0
        if (++takeIndex == items.length)
            takeIndex = 0;
        // 元素数目减1
        count--;
        // 迭代器操作,这个之后再说
        if (itrs != null)
            itrs.elementDequeued();
        // 发出通知告知插入线程可以工作
        notFull.signal();
        return x;
    }

这两个方法是队列操作的基本方法,基本上就是常规的数组数据插入移除,只是有一点很让人困惑 final Object[] items = this.items; 这段代码实现将类成员对象在本地创建了一个引用,然后在本地使用引用进行操作,为什么要多此一举呢?除此之外,代码中大量用到了这种手法,例如: final ReentrantLock lock = this.lock; 这又是为了什么呢?对此笔者猜测可能是和优化相关,因为jdk7中的实现与之不同,是使用的类变量直接操作。在进行了资料查阅后,笔者找到了一个相对靠谱的解释:

这是ArrayBlockingQueue的作者Doug Lea的习惯,他认为这种书写习惯是对机器更加友好的书写

当然也有一些大神有一些其他的解释:

final本身是不可变的,但是由于反射以及序列化操作的存在,final的不可变性就变得捉摸不定,除此之外一些编译器层面上在final上优化的不够好,导致会在使用到数据的时候反复重载导致缓存失效

希望大家可以自己认真思考下,然后尝试下,得到自己的结论。

阻塞队列的插入操作

    public boolean offer(E e) {
        checkNotNull(e);
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            // 如果阻塞队列已满,那么插入失败
            if (count == items.length)
                return false;
            else {
                // 否则插入成功
                enqueue(e);
                return true;
            }
        } finally {
            lock.unlock();
        }
    }

    public void put(E e) throws InterruptedException {
        checkNotNull(e);
        final ReentrantLock lock = this.lock;
        lock.lockInterruptibly();
        try {
            while (count == items.length)
                notFull.await();
            enqueue(e);
        } finally {
            lock.unlock();
        }
    }

    public boolean add(E e) {
        if (offer(e))
            return true;
        else
            throw new IllegalStateException("Queue full");
    }

阻塞队列插入操作大致就以上几种,这几种的区别在代码中也体现得比较清楚了:

  1. offer返回的是布尔值,插入成功返回true否则(队列已满)返回false
  2. put没有返回值,假如队列是满的,他会一直阻塞直到队列为空的时候执行插入操作
  3. add实际上调用的就是offer,只是他在加入失败后会抛出异常

阻塞队列的移除操作

    public E poll() {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            return (count == 0) ? null : dequeue();
        } finally {
            lock.unlock();
        }
    }

    public E take() throws InterruptedException {
        final ReentrantLock lock = this.lock;
        lock.lockInterruptibly();
        try {
            while (count == 0)
                notEmpty.await();
            return dequeue();
        } finally {
            lock.unlock();
        }
    }

    public E peek() {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            return itemAt(takeIndex);
        } finally {
            lock.unlock();
        }
    }
  1. poll执行成功会返回队列元素,如果队列为空则直接返回null
  2. take执行成功会返回队列元素,但是如果队列为空他不会返回而是等待有数据插入,然后取出
  3. peek则是直接获取队列元素,并且执行后不会将元素从队列中删除

迭代器实现

由于迭代器和内部队列共享数据,再加上阻塞队列的特性,导致为了实现迭代器功能,需要新增一些很复杂的代码实现。

内部声明了两个类来实现迭代器,一个是Itr继承Iterator<E>,一个则是Itrs

Itrs

Itrs是用来管理迭代器的。由于阻塞队列内部可能会有多个迭代器在同时工作,在迭代器内部发生删除或者是一些不常见的操作时可能会产生一些问题,比如他们会丢失自己的数据之类的。所以Itrs内部会维护一个变量用于记录循环的圈数,并且在删除操作removeAt的时候会通知所有的迭代器。

    class Itrs {
        // 创建一个Node类作为单向链表(节点是弱引用)来管理迭代器
        private class Node extends WeakReference<Itr> {
            Node next;

            Node(Itr iterator, Node next) {
                super(iterator);
                this.next = next;
            }
        }

        // 循环圈数
        int cycles = 0;

        // 链表头
        private Node head;

        // 清理相关的变量
        private Node sweeper = null;

        private static final int SHORT_SWEEP_PROBES = 4;
        private static final int LONG_SWEEP_PROBES = 16;

        Itrs(Itr initial) {
            register(initial);
        }

        // 清理无效的迭代器(如果sweeper为空,则从头开始,否则从sweeper记录的节点开始)
        void doSomeSweeping(boolean tryHarder) {
            
        }

        // 新增加一个迭代器
        void register(Itr itr) {
            head = new Node(itr, head);
        }

        // 当takeIndex为0时调用此方法
        void takeIndexWrapped() {
            // cycle数+1,内部实现通知所有迭代器并进行清理(链表遍历)
        }

        // 有移除操作的时候调用此方法,并通知所有迭代器进行清理
        void removedAt(int removedIndex) {
            // 简单的链表遍历,内部调用Itr的removedAt方法
        }

        // 当发现队列为空的时候调用此方法,清理迭代器内的弱引用
        void queueIsEmpty() {
            
        }

        // 有元素被取时是调用
        void elementDequeued() {
            // 如果数组为空调用queueIsEmpty进行清理
            if (count == 0)
                queueIsEmpty();
            // 如果takeIndex为0,调用takeIndexWrapped,来进行循环+1操作
            else if (takeIndex == 0)
                takeIndexWrapped();
        }
    }

Itr

Itrs是管理迭代器的,Itr则是迭代器的具体实现

    private class Itr implements Iterator<E> {
        // 游标,用于寻找下一个元素
        private int cursor;

        // 下一个元素
        private E nextItem;

        // 下一个元素的下标
        private int nextIndex;

        // 上一个元素
        private E lastItem;

        // 上一个元素的下标
        private int lastRet;

        // 上一个take的下标
        private int prevTakeIndex;

        // 上一个循环
        private int prevCycles;

        // 标记为空
        private static final int NONE = -1;

        // 删除标记
        private static final int REMOVED = -2;

        // DETACH标记专用于prevTakeIndex
        private static final int DETACHED = -3;

        Itr() {
            // 这是构造函数,内部实现主要是初始化为主,
            // 并且在Itrs不为空的时候进行一波清理操作
        }

        boolean isDetached() {
            return prevTakeIndex < 0;
        }

        private int incCursor(int index) {
            // 游标+1,并重新计算值(判断是否走完一个循环,是否等于putIndex)
            if (++index == items.length)
                index = 0;
            if (index == putIndex)
                index = NONE;
            return index;
        }

        // 判断给的删除数是否是有效值
        private boolean invalidated(int index, int prevTakeIndex,
                                    long dequeues, int length) {
            
        }

        // 计算在迭代器的上一次操作后所有的删除(出队)操作
        private void incorporateDequeues() {
            // 主要方法为通过当前圈数和之前的圈数以及偏移量计算
            // 真实的删除数,并且和prevTakeIndex以及index的偏移量进行比较
        }

        // 进行detach操作并进行清理
        private void detach() {
            
        }

        // 判断是否有下一个节点
        public boolean hasNext() {
            
        }

        // 没有下一个节点(没有detach的节点将会被执行detach操作)
        private void noNext() {
            
        }

        // 找到下个节点
        public E next() {
            // 实现不复杂,主要是需要判断节点是否是detach模式
        }

        // 删除节点
        public void remove() {
            
        }

        // 当队列为空或者后续很难找到下个节点的时候通知迭代器
        void shutdown() {
            
        }

        // 辅助计算游标和prevTakeIndex之间的距离
        private int distance(int index, int prevTakeIndex, int length) {
            
        }

        // 删除节点
        boolean removedAt(int removedIndex) {
            
        }

        // 当takeIndex归0时调用
        boolean takeIndexWrapped() {
            
        }
    }

总结

ArrayBlockingQueue的实现可以说是比较的简单清晰,主要是利用了ReentrantLock内部的Condition,通过设置两个条件来巧妙地完成阻塞队列的实现,只要能够理解这两个条件的工作原理,源码的理解就没有太大的难度。ArrayBlockingQueue较难理解的反而是它内部的迭代器,由于阻塞队列的特性,他的迭代器可能会有丢失当前数据的风险,因此,作者创作的时候加入了许多复杂的方法来保证可靠性,但是在这里由于篇幅限制,以及迭代器在阻塞队列中的地位和重要性并不高,所以简单讲述,如果有兴趣可以自己找一份源码阅读。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 193,968评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,682评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,254评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,074评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,964评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,055评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,484评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,170评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,433评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,512评论 2 308
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,296评论 1 325
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,184评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,545评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,150评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,437评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,630评论 2 335

推荐阅读更多精彩内容