[关闭]
@adamhand 2019-01-20T18:57:11.000000Z 字数 7940 阅读 780

Java并发之ThreadLocal


ThreadLocal是什么

首先说明,ThreadLocal与线程同步无关。ThreadLocal虽然提供了一种解决多线程环境下成员变量的问题,但是它并不是解决多线程共享变量的问题

ThreadLocal类提供了一种线程局部变量(ThreadLocal),即每一个线程都会保存一份变量副本,每个线程都可以独立地修改自己的变量副本,而不会影响到其他线程,是一种线程隔离的思想。

实现原理

ThreadLocal提供四个方法:

  1. public T get() { }
  2. public void set(T value) { }
  3. public void remove() { }
  4. protected T initialValue() { }

get()方法是用来获取ThreadLocal在当前线程中保存的变量副本,set()用来设置当前线程中变量的副本,remove()用来移除当前线程中变量的副本,initialValue()是一个protected方法,一般是用来在使用时进行重写的,它是一个延迟加载方法。这四种方法都是基于ThreadLocalMap的。

ThreadLocalMap

ThreadLocal内部有一个静态内部类ThreadLocalMap,该内部类是实现线程隔离机制的关键。ThreadLocalMap提供了一种用键值对方式存储每一个线程的变量副本的方法,key为当前ThreadLocal对象,value则是对应线程的变量副本。该Map默认的大小是16,即能存储16个键值对,超过后会扩容。

具体源码如下:

Entry类

ThreadLocalMap其内部利用Entry来实现key-value的存储,如下:

  1. static class Entry extends WeakReference<ThreadLocal<?>> {
  2. /** The value associated with this ThreadLocal. */
  3. Object value;
  4. Entry(ThreadLocal<?> k, Object v) {
  5. super(k);
  6. value = v;
  7. }
  8. }

从上面代码中可以看出Entry的key就是ThreadLocal,而value就是值。同时,Entry也继承WeakReference,所以说Entry所对应key(ThreadLocal实例)的引用为一个弱引用。

set方法

  1. private void set(ThreadLocal<?> key, Object value) {
  2. ThreadLocal.ThreadLocalMap.Entry[] tab = table;
  3. int len = tab.length;
  4. // 根据 ThreadLocal 的散列值,查找对应元素在数组中的位置
  5. int i = key.threadLocalHashCode & (len-1);
  6. // 采用“线性探测法”,寻找合适位置
  7. for (ThreadLocal.ThreadLocalMap.Entry e = tab[i];
  8. e != null;
  9. e = tab[i = nextIndex(i, len)]) {
  10. ThreadLocal<?> k = e.get();
  11. // key 存在,直接覆盖
  12. if (k == key) {
  13. e.value = value;
  14. return;
  15. }
  16. // key == null,但是存在值(因为此处的e != null),说明之前的ThreadLocal对象已经被回收了
  17. if (k == null) {
  18. // 用新元素替换陈旧的元素
  19. replaceStaleEntry(key, value, i);
  20. return;
  21. }
  22. }
  23. // ThreadLocal对应的key实例不存在也没有陈旧元素,new 一个
  24. tab[i] = new ThreadLocal.ThreadLocalMap.Entry(key, value);
  25. int sz = ++size;
  26. // cleanSomeSlots 清楚陈旧的Entry(key == null)
  27. // 如果没有清理陈旧的 Entry 并且数组中的元素大于了阈值,则进行 rehash
  28. if (!cleanSomeSlots(i, sz) && sz >= threshold)
  29. rehash();
  30. }

ThreadLocalMap的set方法和Map的put方法差不多,但是有一点区别是:put方法处理哈希冲突使用的是链地址法,而set方法使用的开放地址法

set()操作除了存储元素外,还有一个很重要的作用,就是replaceStaleEntry()和cleanSomeSlots(),这两个方法可以清除掉key == null 的实例,防止内存泄漏。在set()方法中还有一个变量很重要:threadLocalHashCode,定义如下:

  1. private final int threadLocalHashCode = nextHashCode();

threadLocalHashCode是ThreadLocal的散列值,定义为final,表示ThreadLocal一旦创建其散列值就已经确定了,生成过程则是调用nextHashCode():

  1. private static AtomicInteger nextHashCode = new AtomicInteger();
  2. private static final int HASH_INCREMENT = 0x61c88647;
  3. private static int nextHashCode() {
  4. return nextHashCode.getAndAdd(HASH_INCREMENT);
  5. }

nextHashCode表示分配下一个ThreadLocal实例的threadLocalHashCode的值,HASH_INCREMENT则表示分配两个ThradLocal实例的threadLocalHashCode的增量。

getEntry()

  1. private Entry getEntry(ThreadLocal<?> key) {
  2. int i = key.threadLocalHashCode & (table.length - 1);
  3. Entry e = table[i];
  4. if (e != null && e.get() == key)
  5. return e;
  6. else
  7. return getEntryAfterMiss(key, i, e);
  8. }

由于采用了开放定址法,所以当前key的散列值和元素在数组的索引并不是完全对应的,首先取一个探测数(key的散列值),如果所对应的key就是我们所要找的元素,则返回,否则调用getEntryAfterMiss(),如下:

  1. private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
  2. Entry[] tab = table;
  3. int len = tab.length;
  4. while (e != null) {
  5. ThreadLocal<?> k = e.get();
  6. if (k == key)
  7. return e;
  8. if (k == null)
  9. expungeStaleEntry(i);
  10. else
  11. i = nextIndex(i, len);
  12. e = tab[i];
  13. }
  14. return null;
  15. }

这里有一个重要的地方,当key == null时,调用了expungeStaleEntry()方法,该方法用于处理key == null,有利于GC回收,能够有效地避免内存泄漏。

get()方法

  1. public T get() {
  2. // 获取当前线程
  3. Thread t = Thread.currentThread();
  4. // 获取当前线程的成员变量 threadLocal
  5. ThreadLocalMap map = getMap(t);
  6. if (map != null) {
  7. // 从当前线程的ThreadLocalMap获取相对应的Entry
  8. ThreadLocalMap.Entry e = map.getEntry(this);
  9. if (e != null) {
  10. @SuppressWarnings("unchecked")
  11. // 获取目标值
  12. T result = (T)e.value;
  13. return result;
  14. }
  15. }
  16. return setInitialValue();
  17. }

首先通过当前线程获取所对应的成员变量ThreadLocalMap,然后通过ThreadLocalMap获取当前ThreadLocal的Entry,最后通过所获取的Entry获取目标值result。

getMap()方法可以获取当前线程所对应的ThreadLocalMap,如下:

  1. ThreadLocalMap getMap(Thread t) {
  2. return t.threadLocals;
  3. }

set(T value)

  1. public void set(T value) {
  2. Thread t = Thread.currentThread();
  3. ThreadLocalMap map = getMap(t);
  4. if (map != null)
  5. map.set(this, value);
  6. else
  7. createMap(t, value);
  8. }

获取当前线程所对应的ThreadLocalMap,如果不为空,则调用ThreadLocalMap的set()方法,key就是当前ThreadLocal,如果不存在,则调用createMap()方法新建一个,如下:

  1. void createMap(Thread t, T firstValue) {
  2. t.threadLocals = new ThreadLocalMap(this, firstValue);
  3. }

initialValue()

  1. protected T initialValue() {
  2. return null;
  3. }

该方法定义为protected级别且返回为null,很明显是要子类实现它的,所以我们在使用ThreadLocal的时候一般都应该覆盖该方法。

注意:如果想在get之前不需要调用set就能正常访问的话,必须重写initialValue()方法。

因为在上面的代码分析过程中,我们发现如果没有先set的话,即在map中查找不到对应的存储,则会通过调用setInitialValue方法返回i,而在setInitialValue方法中,有一个语句是T value = initialValue(), 而默认情况下,initialValue方法返回的是null。

remove()

  1. public void remove() {
  2. ThreadLocalMap m = getMap(Thread.currentThread());
  3. if (m != null)
  4. m.remove(this);
  5. }

该方法的目的是减少内存的占用。当然,我们不需要显示调用该方法,因为一个线程结束后,它所对应的局部变量就会被垃圾回收。

ThreadLocal使用示例

  1. public class SeqCount {
  2. private static ThreadLocal<Integer> seqCount = new ThreadLocal<Integer>(){
  3. // 实现initialValue()
  4. public Integer initialValue() {
  5. return 0;
  6. }
  7. };
  8. public int nextSeq(){
  9. seqCount.set(seqCount.get() + 1);
  10. return seqCount.get();
  11. }
  12. public void removeSeq(){
  13. seqCount.remove();
  14. }
  15. public static void main(String[] args){
  16. SeqCount seqCount = new SeqCount();
  17. SeqThread thread1 = new SeqThread(seqCount);
  18. SeqThread thread2 = new SeqThread(seqCount);
  19. SeqThread thread3 = new SeqThread(seqCount);
  20. SeqThread thread4 = new SeqThread(seqCount);
  21. thread1.start();
  22. thread2.start();
  23. thread3.start();
  24. thread4.start();
  25. }
  26. private static class SeqThread extends Thread{
  27. private SeqCount seqCount;
  28. SeqThread(SeqCount seqCount){
  29. this.seqCount = seqCount;
  30. }
  31. public void run() {
  32. for(int i = 0 ; i < 3 ; i++){
  33. System.out.println(Thread.currentThread().getName() + " seqCount :" + seqCount.nextSeq());
  34. }
  35. seqCount.removeSeq();
  36. }
  37. }
  38. }

结果如下:

  1. Thread-1 seqCount :1
  2. Thread-3 seqCount :1
  3. Thread-2 seqCount :1
  4. Thread-0 seqCount :1
  5. Thread-2 seqCount :2
  6. Thread-3 seqCount :2
  7. Thread-1 seqCount :2
  8. Thread-3 seqCount :3
  9. Thread-2 seqCount :3
  10. Thread-0 seqCount :2
  11. Thread-1 seqCount :3
  12. Thread-0 seqCount :3

ThreadLocal与内存泄漏

为什么会出现内存泄漏

首先看一下运行时ThreadLocal变量的内存图:



运行时,会在栈中产生两个引用,指向堆中相应的对象。

可以看到,ThreadLocalMap使用ThreadLocal的弱引用作为key,这样一来,当ThreadLocal ref和ThreadLocal之间的强引用断开 时候,即ThreadLocal ref被置为null,下一次GC时,threadLocal对象势必会被回收,这样,ThreadLocalMap中就会出现key为null的Entry,就没有办法访问这些key为null的Entry的value,如果当前线程再迟迟不结束的话,比如使用线程池,线程使用完成之后会被放回线程池中,不会被销毁,这些key为null的Entry的value就会一直存在一条强引用链:Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value永远无法回收,造成内存泄漏。

其实,ThreadLocalMap的设计中已经考虑到这种情况,也加上了一些防护措施:在ThreadLocal的get(),set(),remove()的时候都会清除线程ThreadLocalMap里所有key为null的value。

但是这些被动的预防措施并不能保证不会内存泄漏:

为什么要使用弱引用?

使用弱引用,是为了更好地对ThreadLocal对象进行回收。如果使用强引用,当ThreadLocal ref = null的时候,意味着ThreadLocal对象已经没用了,ThreadLocal对象应该被回收,但由于Entry中还存着这对ThreadLocal对象的强引用,导致ThreadLocal对象不能回收,可能会发生内存泄漏。

为什么不将value也设置成弱引用?

为什么呢?

如何避免内存泄漏?

每次使用完ThreadLocal,都调用它的remove()方法,清除数据。

ThreadLocal与脏读

前面说了,ThreadLocal中的set()、get()和remove()方法都会对key==null的value进行处理,其中set()和get()方法是将key==null的value置为null。但是如果ThreadLocal是static类型的,并且配合线程池使用,线程池会重用Thread对象,同时会重用与Thread绑定的ThreadLocal变量。倘若下一个线程不调用set()方法重新设置初始值,也不调用remove()方法处理旧值,直接调用get()方法获取,就会出现脏读问题。

例子如下。

  1. public class DirtyDataInThreadLocal {
  2. public static ThreadLocal<String> threadLocal = new ThreadLocal<>();
  3. public static void main(String[] args) {
  4. //使用固定大小为1的线程池,说明上一个线程属性会被下一个线程属性复用
  5. ExecutorService pool = Executors.newFixedThreadPool(1);
  6. for(int i = 0; i < 2; i++){
  7. MyThread thread = new MyThread();
  8. pool.execute(thread);
  9. }
  10. }
  11. private static class MyThread extends Thread{
  12. private static boolean flag = true;
  13. @Override
  14. public void run() {
  15. if(flag){
  16. //第一个线程set后,没有remove,第二个线程也没有进行set操作
  17. threadLocal.set(this.getName() + ", session info.");
  18. flag = false;
  19. }
  20. System.out.println(this.getName() + " 线程是 " + threadLocal.get());
  21. }
  22. }
  23. }

打印结果如下:

  1. Thread-0线程是 Thread-0, session info.
  2. Thread-1线程是 Thread-0, session info.

ThreadLocal使用场景

数据连接和Session管理

最常见的ThreadLocal使用场景为 用来解决 数据库连接、Session管理等。

如:

  1. private static ThreadLocal<Connection> connectionHolder = new ThreadLocal<Connection>() {
  2. public Connection initialValue() {
  3. return DriverManager.getConnection(DB_URL);
  4. }
  5. };
  6. public static Connection getConnection() {
  7. return connectionHolder.get();
  8. }
  1. private static final ThreadLocal threadSession = new ThreadLocal();
  2. public static Session getSession() throws InfrastructureException {
  3. Session s = (Session) threadSession.get();
  4. try {
  5. if (s == null) {
  6. s = getSessionFactory().openSession();
  7. threadSession.set(s);
  8. }
  9. } catch (HibernateException ex) {
  10. throw new InfrastructureException(ex);
  11. }
  12. return s;
  13. }

ThreadLocal在Spring中的应用

参考

【死磕Java并发】—–深入分析ThreadLocal
深入分析 ThreadLocal内存泄漏问题
Java并发编程:深入剖析ThreadLocal
Java多线程编程-(8)-多图深入分析ThreadLocal原理
ThreadLocal类详解与源码分析
ThreadLocal解决什么问题
对ThreadLocal实现原理的一点思考
ThreadLocalMap的enrty的key为什么要设置成弱引用
《码出高效 Java开发手册》

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注