ArrayList 简介
ArrayList
的底层是数组队列,相当于动态数组。与 Java 中的数组相比,它的容量能动态增长。在添加大量元素前,应用程序可以使用ensureCapacity
操作来增加 ArrayList
实例的容量。这可以减少递增式再分配的数量。
ArrayList
继承于 AbstractList
,实现了 List
, RandomAccess
, Cloneable
, java.io.Serializable
这些接口。
1 |
|
List
: 表明它是一个列表,支持添加、删除、查找等操作,并且可以通过下标进行访问。RandomAccess
:这是一个标志接口,表明实现这个接口的List
集合是支持 快速随机访问 的。在ArrayList
中,我们即可以通过元素的序号快速获取元素对象,这就是快速随机访问。Cloneable
:表明它具有拷贝能力,可以进行深拷贝或浅拷贝操作。Serializable
: 表明它可以进行序列化操作,也就是可以将对象转换为字节流进行持久化存储或网络传输,非常方便。
ArrayList 和 Vector 的区别?(了解即可)
ArrayList
是List
的主要实现类,底层使用Object[]
存储,适用于频繁的查找工作,线程不安全 。Vector
是List
的古老实现类,底层使用Object[]
存储,线程安全。
ArrayList 可以添加 null 值吗?
ArrayList
中可以存储任何类型的对象,包括 null
值。不过,不建议向ArrayList
中添加 null
值, null
值无意义,会让代码难以维护比如忘记做判空处理就会导致空指针异常。
示例代码:
1 | ArrayList<String> listOfStrings = new ArrayList<>(); |
输出:
1 | [null, java] |
Arraylist 与 LinkedList 区别?
- 是否保证线程安全:
ArrayList
和LinkedList
都是不同步的,也就是不保证线程安全; - 底层数据结构:
ArrayList
底层使用的是Object
数组;LinkedList
底层使用的是 双向链表 数据结构(JDK1.6 之前为循环链表,JDK1.7 取消了循环。注意双向链表和双向循环链表的区别,下面有介绍到!) - 插入和删除是否受元素位置的影响:
ArrayList
采用数组存储,所以插入和删除元素的时间复杂度受元素位置的影响。 比如:执行add(E e)
方法的时候,ArrayList
会默认在将指定的元素追加到此列表的末尾,这种情况时间复杂度就是 O(1)。但是如果要在指定位置 i 插入和删除元素的话(add(int index, E element)
),时间复杂度就为 O(n)。因为在进行上述操作的时候集合中第 i 和第 i 个元素之后的(n-i)个元素都要执行向后位/向前移一位的操作。LinkedList
采用链表存储,所以在头尾插入或者删除元素不受元素位置的影响(add(E e)
、addFirst(E e)
、addLast(E e)
、removeFirst()
、removeLast()
),时间复杂度为 O(1),如果是要在指定位置i
插入和删除元素的话(add(int index, E element)
,remove(Object o)
,remove(int index)
), 时间复杂度为 O(n) ,因为需要先移动到指定位置再插入和删除。
- 是否支持快速随机访问:
LinkedList
不支持高效的随机元素访问,而ArrayList
(实现了RandomAccess
接口) 支持。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)
方法)。 - 内存空间占用:
ArrayList
的空间浪费主要体现在在 list 列表的结尾会预留一定的容量空间,而 LinkedList 的空间花费则体现在它的每一个元素都需要消耗比 ArrayList 更多的空间(因为要存放直接后继和直接前驱以及数据)。
ArrayList 核心源码解读
这里以 JDK1.8 为例,分析一下 ArrayList
的底层源码。
1 | public class ArrayList<E> extends AbstractList<E> |
ArrayList 扩容机制分析
先从 ArrayList 的构造函数说起
ArrayList 有三种方式来初始化,构造方法源码如下(JDK8):
1 | /** |
细心的同学一定会发现:以无参数构造方法创建 ArrayList
时,实际上初始化赋值的是一个空数组。当真正对数组进行添加元素操作时,才真正分配容量。即向数组中添加第一个元素时,数组容量扩为 10。 下面在我们分析 ArrayList
扩容时会讲到这一点内容!
补充:JDK6 new 无参构造的
ArrayList
对象时,直接创建了长度是 10 的Object[]
数组elementData
。
一步一步分析 ArrayList 扩容机制
这里以无参构造函数创建的 ArrayList
为例分析。
add 方法
1 | /** |
注意:JDK11 移除了 ensureCapacityInternal()
和 ensureExplicitCapacity()
方法
ensureCapacityInternal
方法的源码如下:
1 | // 根据给定的最小容量和当前数组元素来计算所需容量。 |
ensureCapacityInternal
方法非常简单,内部直接调用了 ensureExplicitCapacity
方法:
1 | //判断是否需要扩容 |
我们来仔细分析一下:
- 当我们要
add
进第 1 个元素到ArrayList
时,elementData.length
为 0 (因为还是一个空的 list),因为执行了ensureCapacityInternal()
方法 ,所以minCapacity
此时为 10。此时,minCapacity - elementData.length > 0
成立,所以会进入grow(minCapacity)
方法。 - 当
add
第 2 个元素时,minCapacity
为 2,此时elementData.length
(容量)在添加第一个元素后扩容成10
了。此时,minCapacity - elementData.length > 0
不成立,所以不会进入 (执行)grow(minCapacity)
方法。 - 添加第 3、4···到第 10 个元素时,依然不会执行 grow 方法,数组容量都为 10。
直到添加第 11 个元素,minCapacity
(为 11)比 elementData.length
(为 10)要大。进入 grow
方法进行扩容。
grow 方法
1 | /** |
int newCapacity = oldCapacity + (oldCapacity >> 1)
,所以 ArrayList 每次扩容之后容量都会变为原来的 1.5 倍左右(oldCapacity 为偶数就是 1.5 倍,否则是 1.5 倍左右)! 奇偶不同,比如:10+10/2 = 15, 33+33/2=49。如果是奇数的话会丢掉小数.
“>>”(移位运算符):>>1 右移一位相当于除 2,右移 n 位相当于除以 2 的 n 次方。这里 oldCapacity 明显右移了 1 位所以相当于 oldCapacity /2。对于大数据的 2 进制运算,位移运算符比那些普通运算符的运算要快很多,因为程序仅仅移动一下而已,不去计算,这样提高了效率,节省了资源
我们再来通过例子探究一下grow()
方法:
- 当
add
第 1 个元素时,oldCapacity
为 0,经比较后第一个 if 判断成立,newCapacity = minCapacity
(为 10)。但是第二个 if 判断不会成立,即newCapacity
不比MAX_ARRAY_SIZE
大,则不会进入hugeCapacity
方法。数组容量为 10,add
方法中 return true,size 增为 1。 - 当
add
第 11 个元素进入grow
方法时,newCapacity
为 15,比minCapacity
(为 11)大,第一个 if 判断不成立。新容量没有大于数组最大 size,不会进入hugeCapacity
方法。数组容量扩为 15,add 方法中 return true,size 增为 11。 - 以此类推······
这里补充一点比较重要,但是容易被忽视掉的知识点:
- Java 中的
length
属性是针对数组说的,比如说你声明了一个数组,想知道这个数组的长度则用到了 length 这个属性. - Java 中的
length()
方法是针对字符串说的,如果想看这个字符串的长度则用到length()
这个方法. - Java 中的
size()
方法是针对泛型集合说的,如果想看这个泛型有多少个元素,就调用此方法来查看!
hugeCapacity() 方法
从上面 grow()
方法源码我们知道:如果新容量大于 MAX_ARRAY_SIZE
,进入(执行) hugeCapacity()
方法来比较 minCapacity
和 MAX_ARRAY_SIZE
,如果 minCapacity
大于最大容量,则新容量则为Integer.MAX_VALUE
,否则,新容量大小则为 MAX_ARRAY_SIZE
即为 Integer.MAX_VALUE - 8
。
1 | private static int hugeCapacity(int minCapacity) { |
System.arraycopy()
和 Arrays.copyOf()
方法
阅读源码的话,我们就会发现 ArrayList
中大量调用了这两个方法。比如:我们上面讲的扩容操作以及add(int index, E element)
、toArray()
等方法中都用到了该方法!
System.arraycopy()
方法
源码:
1 | // 我们发现 arraycopy 是一个 native 方法,接下来我们解释一下各个参数的具体意义 |
场景:
1 | /** |
我们写一个简单的方法测试以下:
1 | public class ArraycopyTest { |
结果:
1 | 0 1 99 2 3 0 0 0 0 0 |
Arrays.copyOf()
方法
源码:
1 | public static int[] copyOf(int[] original, int newLength) { |
场景:
1 | /** |
个人觉得使用 Arrays.copyOf()
方法主要是为了给原有数组扩容,测试代码如下:
1 | public class ArrayscopyOfTest { |
结果:
1 | 10 |
两者联系和区别
联系:
看两者源代码可以发现 copyOf()
内部实际调用了 System.arraycopy()
方法
区别:
arraycopy()
需要目标数组,将原数组拷贝到你自己定义的数组里或者原数组,而且可以选择拷贝的起点和长度以及放入新数组中的位置 copyOf()
是系统自动在内部新建一个数组,并返回该数组。
ensureCapacity
方法
ArrayList
源码中有一个 ensureCapacity
方法不知道大家注意到没有,这个方法 ArrayList
内部没有被调用过,所以很显然是提供给用户调用的,那么这个方法有什么作用呢?
1 | /** |
理论上来说,最好在向 ArrayList
添加大量元素之前用 ensureCapacity
方法,以减少增量重新分配的次数
我们通过下面的代码实际测试以下这个方法的效果:
1 | public class EnsureCapacityTest { |
运行结果:
1 | 使用ensureCapacity方法前:2158 |
1 | public class EnsureCapacityTest { |
运行结果:
1 | 使用ensureCapacity方法后:1773 |
通过运行结果,我们可以看出向 ArrayList
添加大量元素之前使用ensureCapacity
方法可以提升性能。不过,这个性能差距几乎可以忽略不计。而且,实际项目根本也不可能往 ArrayList
里面添加这么多元素。