[关闭]
@DevWiki 2015-07-02T21:13:44.000000Z 字数 8767 阅读 912

JDK源码学习之String

JDK源码


更多内容详见:DevWiki's Blog

String类是最常用的类之一了.

1.定义

  1. public final class String extends Object implements Serializable, Comparable<String>, CharSequence

1.1 关键字

public

被public修饰的类为全局可访问的类

final

悲final的类为终类,不可被继承不可被覆盖

1.2 继承的父类

Object

直接继承于Object类,Object类为所有Java类的间接或直接父类

1.3 实现的接口

Serializable

实现此接口,说明String类能被序列化

Comparable

实现此接口,说明String类的对象可以被排序

CharSequence

实现此接口,说明String类是一种字符序列

2.Field字段

  1. private final char value[];
  2. private int hash; // Default to 0
  3. private static final long serialVersionUID = -6849794470754667710L;
  4. private static final ObjectStreamField[] serialPersistentFields =
  5. new ObjectStreamField[0];

value[]

用于存放String类对象的值的字符数组,比如

  1. String str = "abc";

那么value[]数组就等于:

  1. value[] = new char[]{'a', 'b', 'c'};

hash

String类对象的哈希值

serialVersionUID

String类运行时序列化的版本号

ObjectStreamField[]

用于String类序列化的描述

3.构造方法

String()

  1. public String() {
  2. this.value = new char[0];
  3. }

创建一个新的String对象,默认字符串长度为0.

String(String original)

  1. public String(String original) {
  2. this.value = original.value;
  3. this.hash = original.hash;
  4. }

用一个已有的String对象创建一个新的String对象.将参数对象的字符数组和哈希值赋值给新的对象.

String(char value[])

  1. public String(char value[]) {
  2. this.value = Arrays.copyOf(value, value.length);
  3. }

用一个字符数组创建一个String对象.内部不是直接赋值,而是使用了Arrays.copyOf()方法:

  1. public static char[] copyOf(char[] original, int newLength) {
  2. char[] copy = new char[newLength];
  3. System.arraycopy(original, 0, copy, 0,
  4. Math.min(original.length, newLength));
  5. return copy;
  6. }

Arrays.copyOf内部新建了一个与参数长度相同的方法,并调用System.arrayscopy()方法复制.

  1. public static native void arraycopy(Object src, int srcPos,
  2. Object dest, int destPos,
  3. int length);

System.arrayscopy()方法是使用的操作系统底层实现复制的.

String(char value[], int offset, int count)

  1. public String(char value[], int offset, int count) {
  2. if (offset < 0) {
  3. throw new StringIndexOutOfBoundsException(offset);
  4. }
  5. if (count < 0) {
  6. throw new StringIndexOutOfBoundsException(count);
  7. }
  8. // Note: offset or count might be near -1>>>1.(2147483647)
  9. if (offset > value.length - count) {
  10. throw new StringIndexOutOfBoundsException(offset + count);
  11. }
  12. this.value = Arrays.copyOfRange(value, offset, offset+count);
  13. }

截取字符数组一部分创建一个新的String对象.
如果起始偏移量或者截取的数量或者起始偏移量与截取数量之和大于字符数组的长度时会抛出StringIndexOutOfBoundsException异常.
而value[]是使用的Arrays.copyOfRange方法截取复制

  1. public static char[] copyOfRange(char[] original, int from, int to) {
  2. int newLength = to - from;
  3. if (newLength < 0)
  4. throw new IllegalArgumentException(from + " > " + to);
  5. char[] copy = new char[newLength];
  6. System.arraycopy(original, from, copy, 0,
  7. Math.min(original.length - from, newLength));
  8. return copy;
  9. }

在Arrays.copyOfRange中创建新的字符数组,并调用系统底层的数组复制方法System.arraycopy.

String(int[] codePoints, int offset, int count)

  1. public String(int[] codePoints, int offset, int count) {
  2. if (offset < 0) {
  3. throw new StringIndexOutOfBoundsException(offset);
  4. }
  5. if (count < 0) {
  6. throw new StringIndexOutOfBoundsException(count);
  7. }
  8. // Note: offset or count might be near -1>>>1.
  9. if (offset > codePoints.length - count) {
  10. throw new StringIndexOutOfBoundsException(offset + count);
  11. }
  12. final int end = offset + count;
  13. // Pass 1: Compute precise size of char[]
  14. int n = count;
  15. for (int i = offset; i < end; i++) {
  16. int c = codePoints[i];
  17. if (Character.isBmpCodePoint(c))
  18. continue;
  19. else if (Character.isValidCodePoint(c))
  20. n++;
  21. else throw new IllegalArgumentException(Integer.toString(c));
  22. }
  23. // Pass 2: Allocate and fill in char[]
  24. final char[] v = new char[n];
  25. for (int i = offset, j = 0; i < end; i++, j++) {
  26. int c = codePoints[i];
  27. if (Character.isBmpCodePoint(c))
  28. v[j] = (char)c;
  29. else
  30. Character.toSurrogates(c, v, j++);
  31. }
  32. this.value = v;
  33. }

截取int型数组的一部分创建新的String对象,新的String对象为Unicode码组成,即将int数组的值转为Unicode码.
如果起始偏移量或者截取的数量或者起始偏移量与截取数量之和大于字符数组的长度时会抛出StringIndexOutOfBoundsException异常.
创建分为两步:
第一步:计算char[]数组的长度
1.先判断int值是否为BMP代码点,是则跳过.
2.判断指定的代码点是否为从 0x0000 到 0x10FFFF 范围之内的有效 Unicode 代码点值,是则加一

第二步:截取赋值字符

String(byte bytes[], int offset, int length, String charsetName)

  1. public String(byte bytes[], int offset, int length, String charsetName)
  2. throws UnsupportedEncodingException {
  3. if (charsetName == null)
  4. throw new NullPointerException("charsetName");
  5. checkBounds(bytes, offset, length);
  6. this.value = StringCoding.decode(charsetName, bytes, offset, length);
  7. }

使用指定的 charset 解码指定的 byte 子数组,构造一个新的 String。
如果未指定charsetName则报空指向异常
checkBounds()方法是检查offset和length是否超过数组边界,此方法是为了复用提取的内部私有方法.

  1. private static void checkBounds(byte[] bytes, int offset, int length) {
  2. if (length < 0)
  3. throw new StringIndexOutOfBoundsException(length);
  4. if (offset < 0)
  5. throw new StringIndexOutOfBoundsException(offset);
  6. if (offset > bytes.length - length)
  7. throw new StringIndexOutOfBoundsException(offset + length);
  8. }

最后使用StringCode进行解码,如果编码方式为null,则默认使用ISO-8859-1编码.

  1. static char[] decode(String charsetName, byte[] ba, int off, int len)
  2. throws UnsupportedEncodingException
  3. {
  4. StringDecoder sd = deref(decoder);
  5. String csn = (charsetName == null) ? "ISO-8859-1" : charsetName;
  6. if ((sd == null) || !(csn.equals(sd.requestedCharsetName())
  7. || csn.equals(sd.charsetName()))) {
  8. sd = null;
  9. try {
  10. Charset cs = lookupCharset(csn);
  11. if (cs != null)
  12. sd = new StringDecoder(cs, csn);
  13. } catch (IllegalCharsetNameException x) {}
  14. if (sd == null)
  15. throw new UnsupportedEncodingException(csn);
  16. set(decoder, sd);
  17. }
  18. return sd.decode(ba, off, len);
  19. }

StringCoding类为java.lang包内部的字符编码和解码的工具类;StringDecoder和StringEncoder类是StringCoding类内部的解码和编码类.

String(byte bytes[], String charsetName)

  1. public String(byte bytes[], String charsetName)
  2. throws UnsupportedEncodingException {
  3. this(bytes, 0, bytes.length, charsetName);
  4. }

用byte数组和指定的编码方式创建一个String对象.

String(byte bytes[], int offset, int length)

  1. public String(byte bytes[], int offset, int length) {
  2. checkBounds(bytes, offset, length);
  3. this.value = StringCoding.decode(bytes, offset, length);
  4. }

截取byte数组一部分创建一个String对象.
先检查数组边界,在调用了StringCoding编码.

String(byte bytes[])

  1. public String(byte bytes[]) {
  2. this(bytes, 0, bytes.length);
  3. }

用byte数组创建一个String对象,内部调用的是String(byte bytes[], int offset, int length)方法.

String(StringBuffer buffer)

  1. public String(StringBuffer buffer) {
  2. synchronized(buffer) {
  3. this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
  4. }
  5. }

用一个StringBuffer对象创建一个String对象,采用同步操作,多线程对buffer的操作不会影响String对象的值.内部使用Arrays.copyOf方法复制字符数组.

String(StringBuilder builder)

  1. public String(StringBuilder builder) {
  2. this.value = Arrays.copyOf(builder.getValue(), builder.length());
  3. }

使用一个StringBuilder对象创建一个String对象.内部使用Arrays.copyOf复制字符数组.

String(char[] value, boolean share)

  1. public String(char[] value, boolean share) {
  2. // assert share : "unshared not supported";
  3. this.value = value;
  4. }

使用一个char数组创建一个String对象,直接将char数组的引用传递给内部的value数组.

4.类方法

copyValueOf(char data[])

  1. public static String copyValueOf(char data[]) {
  2. return new String(data);
  3. }

返回指定数组中表示该字符序列的 String。即调用构造方法用数组生成一个String对象.比如:

  1. char[] data = new char[]{'1', '2', '3'};
  2. String str = String.coprValueOf(data);

结果为:123

copyValueOf(char data[], int offset, int count)

  1. public static String copyValueOf(char data[], int offset, int count) {
  2. return new String(data, offset, count);
  3. }

返回指定数组中一份表示该字符序列的 String。即调用构造方法用数组生成一个String对象.比如:

  1. char[] data = new char[]{'1', '2', '3'};
  2. String str = String.coprValueOf(data, 0, 3);

结果为:123

format(String format, Object... args)

  1. public static String format(String format, Object... args) {
  2. return new Formatter().format(format, args).toString();
  3. }

使用指定的格式字符串和参数返回一个格式化字符串。内部调用Formatter类的format方法.
Formatter类是printf 风格的格式字符串的解释程序.使用了Formatter的无参构造方法:

  1. public Formatter() {
  2. this(Locale.getDefault(Locale.Category.FORMAT), new StringBuilder());
  3. }

而此方法内部默认调用两个参数的构造方法.其中的Local对象为系统获取当前运行系统的默认区域并新建了一个StringBuilder对象,StringBuilder的父类实现了Appendable接口,说明StringBuilder是可以继续拼接修改的

  1. Local local = Locale.getDefault(Locale.Category.FORMAT);
  2. StringBuilder builder = new StringBuilder();

在调用Formatter类的format方法时默认使用默认的区域格式.

  1. public Formatter format(String format, Object ... args) {
  2. return format(l, format, args);
  3. }

内部又调用了format(Locale l, String format, Object ... args)

  1. public Formatter format(Locale l, String format, Object ... args) {
  2. ensureOpen();
  3. // index of last argument referenced
  4. int last = -1;
  5. // last ordinary index
  6. int lasto = -1;
  7. FormatString[] fsa = parse(format);
  8. for (int i = 0; i < fsa.length; i++) {
  9. FormatString fs = fsa[i];
  10. int index = fs.index();
  11. try {
  12. switch (index) {
  13. case -2: // fixed string, "%n", or "%%"
  14. fs.print(null, l);
  15. break;
  16. case -1: // relative index
  17. if (last < 0 || (args != null && last > args.length - 1))
  18. throw new MissingFormatArgumentException(fs.toString());
  19. fs.print((args == null ? null : args[last]), l);
  20. break;
  21. case 0: // ordinary index
  22. lasto++;
  23. last = lasto;
  24. if (args != null && lasto > args.length - 1)
  25. throw new MissingFormatArgumentException(fs.toString());
  26. fs.print((args == null ? null : args[lasto]), l);
  27. break;
  28. default: // explicit index
  29. last = index - 1;
  30. if (args != null && last > args.length - 1)
  31. throw new MissingFormatArgumentException(fs.toString());
  32. fs.print((args == null ? null : args[last]), l);
  33. break;
  34. }
  35. } catch (IOException x) {
  36. lastException = x;
  37. }
  38. }
  39. return this;
  40. }

此方法返回的是一个Formatter对象,然后调用了toString方法,将a打印输出.

  1. public String toString() {
  2. ensureOpen();
  3. return a.toString();
  4. }

String valueOf(Object obj)

  1. public static String valueOf(Object obj) {
  2. return (obj == null) ? "null" : obj.toString();
  3. }

将一个对象转为String对象,调用该对象的toString方法.

String valueOf(char[] data)

  1. public static String valueOf(char[] data) {
  2. return new String(data, 0, data.length);
  3. }

调用String的构造方法创建一个String对象.

String valueOf(char[] data, int start, int length)

  1. public static String valueOf(char[] data, int start, int length) {
  2. return new String(data, start, length);
  3. }

调用String的构造方法创建一个String对象.
此系列的方法还有:
String valueOf(boolean b)

  1. public static String valueOf(boolean b) {
  2. return b ? "true" : "false";
  3. }

String valueOf(char value)

  1. public static String valueOf(char c) {
  2. char data[] = {c};
  3. return new String(data, true);
  4. }

一以下方法均是调用相应的包装类的toString方法.

  1. String valueOf(char c)
  2. String valueOf(int i)
  3. String valueOf(long l)
  4. String valueOf(float f)
  5. String valueOf(double d)
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注