@w1992wishes
2018-05-10T09:35:35.000000Z
字数 6538
阅读 1029
JAVA_java容器
源码分析
本篇结构:
同HashMap一样,ArrayList是很常用的集合类了,其源码相对来说简单一些,下面简单分析一下。
ArrayList的底层数据结构就是一个Object数组,一个可变的数组,对于其的所有操作都是通过数组来实现的。
// 默认容量,默认10个元素
private static final int DEFAULT_CAPACITY = 10;
// 空对象数组
private static final Object[] EMPTY_ELEMENTDATA = {};
// 默认空对象数组,通过空的构造参数生成的ArrayList实例
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
// ArrayList对象实际上就是一个容器数组
transient Object[] elementData; // non-private to simplify nested class access
// 实际元素大小,默认为0
private int size;
// 最大数组容量
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
public class ArrayListTest {
public static void main(String[] args) {
// 1.new
List<String> list = new ArrayList<>();
// 2.add
list.add("java");
list.add("python");
list.add("kotlin");
// 3.get
System.out.println("the second element is: " + list.get(1));
// 4.set
list.set(1, "c++");
// 5.遍历
for (String s : list){
System.out.println(s);
}
}
}
还有remove,indexOf等方法,就不一一列了。
对于循环遍历,有普通的for循环(for ... i这种),增强for循环,迭代器。一般而言,普通for循环效率高些,增强for循环是使用迭代器来实现的,使用更加简单。
// 1.无参构造
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
// 2.指定初始容量
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
// 3.传入一个集合,会把集合类型转化为数组类型,并赋值给elementData
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
三个构建方法都相对简单,直接看代码应该都能清楚。
// 添加元素总体可分为两步,一步是容量检测&容量动态增加,另一步是将新的元素添加到数组的末尾
public boolean add(E e) {
// 1.容量检测&容量动态增加
ensureCapacityInternal(size + 1); // Increments modCount!!\
// 2.将新的元素添加到数组的末尾
elementData[size++] = e;
return true;
}
// 调用该方法保证内部容量
private void ensureCapacityInternal(int minCapacity) {
// 1-1.如果数组容器为空,初始化容器的容量,默认为10
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
// 1-2.确保数组长度大于等于最小容量
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
// modCount为操作次数,每次数据结构改变,都会调用该属性modCount++
modCount++;
// overflow-conscious code
// 当容器数组的长度已经满足不了需求的最小容量时,进行扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
//位运算符扩容,容量在当前的基础上+50%
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
// 扩容完毕,将扩容后的数组赋值给elementData
elementData = Arrays.copyOf(elementData, newCapacity);
}
add方法先要确保数组的容量足够,防止数组已经填满还往里面添加数据造成数组越界:
1. 如果数组容量足够,则直接在数组的末尾添加元素;
2. 如果数组容量不够,则进行扩容,容量为原数组容量的1.5倍,然后将原数组中的元素全部copy到新数组中,接着再往数组末尾添加元素;
也可以发现,如果new了一个无参的ArrayList对象,第一次调用add时会初始化一个容量为10的数组。
// 在确定索引下新增元素
public void add(int index, E element) {
// 1.首先要确保该索引要>0并且<=数组长度(index <= size && index > 0)
rangeCheckForAdd(index);
// 2.确保数组容量>=size+1
ensureCapacityInternal(size + 1); // Increments modCount!!
// 3.将index索引位置(包括)及之后的元素都向后挪动一位
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
// 4.将index索引处设置为新增元素
elementData[index] = element;
size++;
}
因为涉及数组的复制,可以想象如果index后面有大量的元素,所消耗的性能是非常大的。
public E set(int index, E element) {
// 1.首先确保索引不能大于数组长度
rangeCheck(index);
E oldValue = elementData(index);
// 2.直接替换元素
elementData[index] = element;
return oldValue;
}
该方法比较简单。
public E get(int index) {
// 1.防止越界,索引不能大于数组长度
rangeCheck(index);
// 2.直接返回索引处的元素
return elementData(index);
}
get方法也很简单,直接返回数组索引处得元素。
public E remove(int index) {
// 1.防止越界,索引不能大于数组长度
rangeCheck(index);
// 操作数量+1
modCount++;
E oldValue = elementData(index);
// 2.将index后的元素都向前挪动一位,原index的元素就删除了
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
// 3.数组长度减1
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
可见删除操作也是很耗性能的,因为涉及到了数组的复制。
// 因为Arraylist可以添加null,所以分两种情况,为null和非null
public boolean remove(Object o) {
// 1.如果删除的元素是null,则遍历删除第一个null
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
// 2.非null,删除第一个equals的元素
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
// 删除,同样是将index后的元素都向前挪动一位
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
public class ArrayListForEachTest {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("a");
list.add("b");
list.add("c");
list.add("d");
list.add("e");
list.add("f");
for (String s : list) {
if (s.equals("b")){
list.remove(s);
}
}
}
}
除了删除倒数第二个元素外,其它都会报错:
分析一下原因:
因为for-Each删除是基于迭代器。
这里面主要有两个变量在捣鬼,expectedModCount和modCount:
modCount前面介绍过,记录了ArrayList的操作次数,expectedModCount则是期望的操作此时,在其内部类Itr中可以找到。
先看看迭代器的代码,再来分析。
private class Itr implements Iterator<E> {
int cursor; // index of next element to return
int lastRet = -1; // index of last element returned; -1 if no such
int expectedModCount = modCount;
public boolean hasNext() {
return cursor != size;
}
@SuppressWarnings("unchecked")
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
}
如上,当遍历时,会基于迭代器进行,此时expectedModCount = modCount,在遍历的过程中一直到remove操作,这两个值都一样,但是一旦执行了remove操作,由前面分析remove方法可知,modCount会加1,接着继续执行,会再次调用itr的hasNext()方法,为true时,调用next方法,该方法会调用checkForComodification方法,这时modCount != expectedModCount,抛出异常。
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
但如果是删除倒数第二个元素,删除后,cursor已经等于size-1,而由于已成功删除一个元素,此处的size也是原size()-1,两者相等,所以hasNext返回false,也就不会调用next,所有不会报错。
为什么不能在ArrayList的For-Each循环中删除元素
了解了以上,相信下面几道面试题应该能解答了。
当操作是大量查询和获取,或需要随机地访问其中的元素时,ArrayList非常适合,如果是向某个位置添加元素或者删除元素,因为涉及数组的复制,ArrayList效率不高。