在介绍LinkedList之前我们先来简单介绍一下链表这种数据结构,与顺序表不同,链表不限制数据的物理存储状态,换句话说,使用链表存储的数据元素,其物理存储位置是随机的。链表存储数据的单元叫做节点,每个节点的存储都包括数据元素本身,其所在的区域称为数据域,指向直接后继元素的指针,所在的区域称为指针域;链表的基本结构如下图所示
上面讲到的链表每个节点指针域都是指向后面一个节点,也就是直接后继节点,这类链表叫做单向链表或者单链表,单向链表有一个天生的缺点就是无法查找指定节点的前驱节点,为了解决这个问题,双向链表应运而生。双向链表与单向链表相比,多了一个指向前驱节点的指针域,该指针直接指向前驱节点,双向链表的基本结构如下图所示。
从上图可以看出,双向链表每一个节点包括三个部分,前驱指针域,数据本身,后继指针域,同时还存在始终指向头结点的HEAD指针和始终指向尾节点的LAST指针。本文所讲到的LinkedList集合类就是采用双向链表的数据结构来存储数据的。
那么链表跟ArrayList采用的数组线性表相比有什么优缺点呢?
那么链表跟ArrayList采用的数组线性表相比有什么优缺点呢?
1、数组线性表需要一块连续的内存存储空间来存储数据,而链表由于指针的存在,不需要存储空间连续,只要有存储空间,数据可随意存取。
2、数组线性表查找数据快,直接通过下标可直接获取;而链表需要遍历整个链表,效率相对较低。
3、数组线性表添加和删除需要移动数组元素,速度相对慢;而链表添加删除数据只需要改变指针指向就可以了,速度相对快。
4、数组线性表一旦定义长度无法动态增长;链表存储是在程序运行过程中动态的分配空间
5、链表需要额外的空间来存储指针。
分析完链表数据结构,下面我们结合源码来分析下LinkedList到底是如何实现数据存取操作的。
首先来看数据节点的定义,结合上面的所讲的双向链表的结构,定义的Node类为链表的节点,item为数据本身,next为指向后继节点指针,prev为指向前驱节点指针。
LinkedList共有两个构造函数,无参构造函数生成一个空的链表,带集合类构造函数将指定集合类数据构造到链表。
接下来我们继续看下LinkedList的数据操作
(1)、添加数据。
Add方法默认将数据添加到链表末尾,在添加新元素数据时,首先创建一个节点用来保存数据,该节点的前驱节点指向当前的尾节点,该节点的后继节点指向NULL,当前尾节点的后继节点指向新创建的节点,具体过程简化为下图。
(2)、添加数据到指定位置。上面我们讲到的add方法是将新数据添加到链表末尾,那么如何将新数据添加到指定位置呢,继续看源码。
源码中首先会去检查位置的有效性,下标必须在0到当前链表大小范围之内才是有效的位置。
接下来开始添加数据,如果下标为链表大小,相当于需要将新数据添加到链表末尾,处理方式就是我们在(1)中讲的过程,这里不再赘述;如果在链表中间位置添加数据,首先会调用node(int index)方法,该方法通过遍历链表获取添加数据之前index位置的节点,那么如何遍历呢?这里不是纯粹的从头节点开始遍历,而是首先判断index位置,如果是在链表的前半部分则从头结点开始遍历,如果index位置在链表的后半部分,则开始从尾节点向前遍历,这样大大节省了遍历的效率,这里拿到的节点我们称作老节点。具体源码如下:
获取到index位置的节点之后,开始向链表中添加数据,具体操作就是首先创建一个新数据节点,新节点的前驱节点为老节点前驱节点,新节点的后继节点为老节点,同时更新老节点前驱节点的后继节点为新节点,更新老节点的前驱节点为新节点,文字描述起来有点绕,下面为具体源码及详细过程。
(3)、获取指定位置元素。获取指定位置元素其实在上面的(2)中已经提到过,就是node(int index)方法的实现,这里的获取跟上面的逻辑完全一样,这里就不在赘述。
(4)、删除指定位置元素。经过以上对添加数据原理的深入了解,删除元素的具体逻辑其实可以对照来看,首先是检查下标的有效性,然后通过node(int index)方法找到指定位置的节点,也就是删除的目标节点,接下来就是对指针域的操作,如果目标节点的前驱节点为空,则说明目标节点就是首节点,那么直接将目标的节点的后继节点直接当做首节点就可以了;如果目标节点不是首节点,则将目标节点的后继节点作为目标节点前驱节点的后继节点就可以了;如果目标节点的后继节点为空,则说明目标节点为尾节点,则直接将目标节点的前驱节点作为尾节点就可以了;如果目标节点不是尾节点,则将目标节点的前驱节点作为目标节点后继节点的前驱节点就可以了。同样我们将过程通过图的形式表现出来更容易理解一些。
(5)、删除指定元素。删除指定元素的中心思想还是通过遍历链表找到目标元素的下标位置,然后通过上面讲到的通过删除指定位置的元素来进行删除。
总结:LinkedList采用的是双向链表的数据结构来存取数据的,与ArrayList相比,LinkedList有更快的添加和删除操作,但是读取数据的速度相对ArrayList来说相对较慢,这里的快慢一定是针对大数据量而言的。另外LinkedList的所有方法与ArrayList一样,都是非线程安全的,在多线程环境下使用,需要我们进行数据操作的同步控制。
才疏学浅,码字不易,有总结不到位的请各路大神多多指教,欢迎交流!