@zhutoulwz 2015-03-30T13:49:00.000000Z 字数 4299 阅读 2691

Java常用集合类总结

Java

List接口与其实现类

List类似于数组，可以通过索引来访问元素，实现该接口的常用类有ArrayList、LinkedList、Vector、Stack等。

ArrayList

ArrayList是动态数组，可以根据插入的元素的数量自动扩容，而使用者不需要知道其内部是什么时候进行扩展的，把它当作足够容量的数组来使用即可。
ArrayList访问元素的方法get是常数时间，因为是直接根据下标索引来访问的，而add方法的时间复杂度是O(n)，因为需要移动元素，将新元素插入到合适的位置。
ArrayList是非线程安全的，即它没有同步，不过，可以通过Collections.synchronizedList()静态方法返回一个同步的实例，如：

List synList = Collections.synchronizedList(list);

数组扩容：ArrayList在插入元素的时候，都会检查当前的数组大小是否足够，如果不够，将会扩容到当前容量 * 1.5 + 1（加1是为了当前容量为1时，也能扩展到2），即把原来的元素全部复制到一个两倍大小的新数组，将旧的数组抛弃掉(等待垃圾回收)，这个操作是比较耗时，因此建议在创建ArrayList的时候，根据要插入的元素的数量来初步估计Capacity，并初始化ArrayList，如：

ArrayList list = new ArrayList(100);

这样，在插入小于100个元素的时候都是不需要进行扩容的，能够带来性能的提升，当然，如果对这个容量估计大了，可能会带来一些空间的损耗。

LinkedList

LinkedList也实现了List接口，其内部实现是使用双向链表来保存元素，因此插入与删除元素的性能都表现不错。它还提供了一些其它操作方法，如在头部、尾部插入或者删除元素，因此，可以用它来实现栈、队列、双向队列。
由于是使用链表保存元素的，所以随机访问元素的时候速度会比较慢(需要遍历链表找到目标元素)，这一点相比ArrayList的随机访问要差，ArrayList是采用数组实现方式，直接使用下标可以访问到元素而不需要遍历。因此，在需要频繁随机访问元素的情况下，建议使用ArrayList。
与ArrayList一样，LinkedList也是非同步的，如果需要实现多线程访问，则需要自己在外部实现同步方法。当然也可以使用Collections.synchronizedList()静态方法。

Vector

Vector是ArrayList的线程同步版本，即是说Vector是同步的，支持多线程访问。除此之外，还有一点不同时，当容量不够时，Vector默认扩展一倍容量，而ArrayList是当前容量 * 1.5 + 1

Stack

Stack是一种后进先出的数据结构，继承自Vector类，提供了push、pop、peek（获得栈顶元素）等方法。

Set接口

Set是不能包含重合元素的容器，其实现类有HashSet，继承于它的接口有SortedSet接口等。Set中提供了加、减、和交等集合操作函数。Set不能按照索引随机访问元素，这是它与List的一个重要区别。

HashSet

HashSet实现了Set接口，其内部是采用HashMap实现的。放入HashSet的对象最好重写hashCode、equals方法，因为默认的这两个方法很可能与你的业务逻辑是不一致的，而且，要同时重写这两个函数，如果只重写其中一个，很容易发生意想不到的问题。
记住下面几条规则：

相等对象，hashCode一定相等。
不等对象，hashCode不一定不相等。
两个对象的hashCode相同，不一定相等。
两个对象的hashCode不同，一定相等。

TreeSet

TreeSet同样的Set接口的实现类，同样不能存放相同的对象。它与HashSet不同的是，TreeSet的元素是按照顺序排列的，因此用TreeSet存放的对象需要实现Comparable接口。

Map接口

Map集合提供了按照“键值对”存储元素的方法，一个键唯一映射一个值。集合中“键值对”整体作为一个实体元素时，类似List集合，但是如果分开来年，Map是一个两列元素的集合：键是一列，值是一列。与Set集合一样，Map也没有提供随机访问的能力，只能通过键来访问对应的值。
Map的每一个元素都是一个Map.Entry，这个实体的结构是< Key, Value >样式。

HashMap

HashMap实现了Map接口，但它是非线程安全的。HashMap允许key值为null，value也可以为null。

Hashtable

Hashtable也是Map的实现类，继承自Dictionary类。它与HashMap不同的是，它是线程安全的。而且它不允许key为null，value也不能为null。
由于它是线程安全的，在效率上稍差于HashMap。

List总结

ArrayList内部实现采用动态数组，当容量不够时，自动扩容至（当前容量*1.5+1）。元素的顺序按照插入的顺序排列。默认初始容量为10。
contains复杂度为O(n)，add复杂度为分摊的常数，即添加n个元素需要O(n)时间，remove为O(n)，get复杂度为O(1)
随机访问效率高，随机插入、删除效率低。ArrayList是非线程安全的。

LinkedList内部使用双向链表实现，随机访问效率低，随机插入、删除效率高。可以当作堆栈、队列、双向队列来使用。LinkedList也是非线程安全的。

Vector跟ArrayList是类似的，内部实现也是动态数组，随机访问效率高。Vector是线程安全的。

Stack是栈，继承于Vector，其各种操作也是基于Vector的各种操作，因此其内部实现也是动态数组，先进后出。Stack是线程安全的。

List使用场景

对于需要快速插入、删除元素，应该使用LinkedList
对于需要快速随机访问元素，应该使用ArrayList
如果List需要被多线程操作，应该使用Vector，如果只会被单线程操作，应该使用ArrayList

Set总结

HashSet内部是使用HashMap实现的，HashSet的key值是不允许重复的，如果放入的对象是自定义对象，那么最好能够同时重写hashCode与equals函数，这样就能自定义添加的对象在什么样的情况下是一样的，即能保证在业务逻辑下能添加对象到HashSet中，保证业务逻辑的正确性。另外，HashSet里的元素不是按照顺序存储的。HashSet是非线程安全的。

TreeSet存储的元素是按顺序存储的，如果是存储的元素是自定义对象，那么需要实现Comparable接口。TreeSet也是非线程安全的。

LinkedHashSet继承自HashSet，它与HashSet不同的是，LinkedHashSet存储元素的顺序是按照元素的插入顺序存储的。LinkedHashSet也是非线程安全的。

Map总结

HashMap存储键值对。当程序试图将一个key-value对放入 HashMap 中时，程序首先根据该key的hashCode()返回值决定该Entry的存储位置：如果两个Entry的key的hashCode() 返回值相同，那它们的存储位置相同。如果这两个Entry的key通过equals比较返回true，新添加Entry的value将覆盖集合中原有Entry的 value，但key不会覆盖。如果这两个Entry的key通过equals 比较返回false，新添加的Entry将与集合中原有Entry形成Entry 链，而且新添加的 Entry 位于 Entry 链的头部。看下面HashMap添加键值对的源代码：

public V put(K key, V value) {
    if (key == null)
        return putForNullKey(value);
    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(hash, key, value, i);
    return null;
}
void addEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
    table[bucketIndex] = new Entry<>(hash, key, value, e);
    if (size++ >= threshold)
        resize(2 * table.length);
}

HashMap允许key、value值为null。HashMap是非线程安全的。

Hashtable是HashMap的线程安全版本。而且，key、value都不允许为null。

哈希值的使用不同: Hashtable直接使用对象的hashCode，如下代码：

int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;

而HashMap重新计算hash值，如下代码：

int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
static int hash(int h) {
    // This function ensures that hashCodes that differ only by
    // constant multiples at each bit position have a bounded
    // number of collisions (approximately 8 at default load factor).
    h ^= (h >>> 20) ^ (h >>> 12);
    return h ^ (h >>> 7) ^ (h >>> 4);
}
static int indexFor(int h, int length) {
    return h & (length-1);
}

扩展容量不同： Hashtable中hash数组默认大小是11，增加的方式是 old*2+1。HashMap中hash数组的默认大小是16，而且一定是2的指数。