@cxm-2016
2016-12-12T10:34:54.000000Z
字数 6845
阅读 2550
Kotlin
版本:1
翻译:李颖
与 Java 一样, Kotlin 中的类也可以有类型参数:
class Box<T>(t: T) {
var value = t
}
通常, 要创建这样一个类的实例, 我们需要指定类型参数:
val box: Box<Int> = Box<Int>(1)
但是, 如果类型参数可以通过推断得到, 比如, 通过构造器参数类型, 或通过其他手段推断得到, 此时允许省略类型参数:
val box = Box(1) // 1 的类型为 Int, 因此编译器知道我们创建的实例是 Box<Int> 类型
Java 的类型系统中, 最微妙, 最难于理解和使用的部分之一, 就是它的通配符类型(wildcard type) (参见 Java 泛型 FAQ).
Kotlin 中不存在这样的通配符类型. 它使用另外的两种东西: 声明处类型变异(declaration-site variance), 以及类型投射(type projection).
首先, 我们来思考一下为什么 Java 需要那些神秘的通配符类型. 这个问题已有详细的解释, 请参见 Effective Java, 第 28 条: 为增加 API 的灵活性, 应该使用限定范围的通配符类型(bounded wildcard).
首先, Java 中的泛型类型是 不可变的(invariant), 也就是说 List<String>
不是 List<Object>
的子类型.
为什么会这样? 因为, 如果 List 不是 不可变的(invariant), 那么下面的代码将可以通过编译, 然后在运行时导致一个异常, 那么 List 就并没有任何优于 Java 数组的地方了:
// Java
List<String> strs = new ArrayList<String>();
List<Object> objs = strs; // !!! 导致后面问题的原因就在这里. Java 会禁止这样的代码!
objs.add(1); // 在这里, 我们向 String 组成的 List 添加了一个 Integer 类型的元素
String s = strs.get(0); // !!! ClassCastException: 无法将 Integer 转换为 String
由于存在这种问题, Java 禁止上面示例中的做法, 以便保证运行时刻的类型安全. 但这个原则背后存在一些隐含的影响. 比如, 我们来看看 Collection
接口的 addAll()
方法. 这个方法的签名应该是什么样的? 直觉地, 我们会将它定义为:
// Java
interface Collection<E> ... {
void addAll(Collection<E> items);
}
但是, 这样的定义会导致我们无法进行下面这种非常简单的操作(尽管这种操作是绝对安全的):
// Java
void copyAll(Collection<Object> to, Collection<String> from) {
to.addAll(from); // !!! 如果 addAll 方法使用前面那种简单的定义, 这里的调用将无法通过编译:
// 因为 Collection<String> 不是 Collection<Object> 的子类型
}
(在 Java 语言中, 我们通过非常痛苦的方式才学到了这个教训, 详情请参见 Effective Java, 第 25 条: 尽量使用 List, 而不是数组)
正因为上面的问题, 所以 addAll()
的签名定义其实是这样的:
// Java
interface Collection<E> ... {
void addAll(Collection<? extends E> items);
}
这里的 通配符类型参数(wildcard type argument) ? extends T
表示, 该方法接受的参数是一个集合, 集合元素的类型是 T
的某种子类型, 而不限于 T
本身.
这就意味着, 我们可以安全地从集合元素中 读取 T
(因为集合的元素是 T 的某个子类型的实例), 但 不能写入 到集合中去, 因为我们不知道什么样的对象实例才能与这个 T
的未知子类型匹配.
尽管有这样的限制, 作为回报, 我们得到了希望的功能: Collection<String>
是 Collection<? extends Object>
的子类型.
用"高级术语"来说, 指定了 extends 边界 (上 边界)的通配符类型, 使得我们的类型成为一种 协变(covariant) 类型.
要理解这种技巧的工作原理十分简单: 如果你只能从一个集合 取得 元素, 那么就可以使用一个 String
组成的集合, 并从中读取 Object
实例. 反过来, 如果你只能向集合 放入 元素, 那么就可以使用一个 Object
组成的集合, 并向其中放入 String
: 在 Java 中, 我们可以使用 List<? super String>
, 它是 List<Object>
的一个 父类型.
上面的后一种情况称为 反向类型变异(contravariance), 对于 List<? super String>
, 你只能调用那些接受 String 类型参数的方法(比如, 可以调用 add(String)
, 或 set(int, String)
), 而当你对 List<T>
调用返回类型为 T
的方法时, 你得到的返回值将不会是 String
类型, 而只是 Object
类型.
Joshua Bloch 将那些只能 读取 的对象称为 生产者(Producer), 将那些只能 写入 的对象称为 消费者(Consumer). 他建议: "为尽量保证灵活性, 应该对代表生产者和消费者的输入参数使用通配符类型", 他还提出了下面的记忆口诀:
PECS: 生产者(Producer)对应 Extends, 消费者(Consumer) 对应 Super.
注意: 如果你使用一个生产者对象, 比如, List<? extends Foo>
, 你将无法对这个对象调用 add()
或 set()
方法, 但这并不代表这个对象是 值不变的(immutable): 比如, 你完全可以调用 clear()
方法来删除 List 内的所有元素, 因为 clear()
方法不需要任何参数. 通配符类型(或者其他任何的类型变异)唯一能够确保的仅仅是 类型安全. 对象值的不变性(Immutability)是与此完全不同的另一个问题.
假设我们有一个泛型接口 Source<T>
, 其中不存在任何接受 T
作为参数的方法, 仅有返回值为 T
的方法:
// Java
interface Source<T> {
T nextT();
}
那么, 完全可以在 Source<Object>
类型的变量中保存一个 Source<String>
类型的实例 -- 因为不存在对消费者方法的调用. 但 Java 不能理解这一点, 因此仍然禁止以下代码:
// Java
void demo(Source<String> strs) {
Source<Object> objects = strs; // !!! 在 Java 中禁止这样的操作
// ...
}
为了解决这个问题, 我们不得不将对象类型声明为 Source<? extends Object>
, 其实是毫无意义的, 因为我们在这样修改之后, 我们所能调用的方法与修改之前其实是完全一样的, 因此, 使用这样复杂的类型声明并未带来什么好处. 但编译器并不理解这一点.
在 Kotlin 中, 我们有办法将这种情况告诉编译器. 这种技术称为 声明处的类型变异(declaration-site variance): 我们可以对 Source 的 类型参数 T
添加注解, 来确保 Source<T>
的成员函数只会 返回 (生产) T
类型, 而绝不会消费 T
类型.
为了实现这个目的, 我们可以对 T
添加 out 修饰符:
abstract class Source<out T> {
abstract fun nextT(): T
}
fun demo(strs: Source<String>) {
val objects: Source<Any> = strs // 这是 OK 的, 因为 T 是一个 out 类型参数
// ...
}
一般规则是: 当 C
类的类型参数 T
声明为 out 时, 那么在 C
的成员函数中, T
类型只允许出现在 输出 位置, 这样的限制带来的回报就是, C<Base>
可以安全地用作 C<Derived>
的父类型.
用"高级术语"来说, 我们将 C
类称为, 在类型参数 T
上 协变的(covariant), 或者说 T
是一个 协变的(covariant) 类型参数.
你可以将 C
类看作 T
类型对象的 生产者, 而不是 T
类型对象的 消费者.
out 修饰符称为 协变注解(variance annotation), 而且, 由于这个注解出现在类型参数的声明处, 因此我们称之为 声明处的类型变异(declaration-site variance).
这种方案与 Java 中的 使用处类型变异(use-site variance) 刚好相反, 在 Java 中, 是类型使用处的通配符产生了类型的协变.
除了 out 之外, Kotlin 还提供了另一种类型变异注解: in. 这个注解导致类型参数 反向类型变异(contravariant): 这个类型将只能被消费, 而不能被生产. 反向类型变异的一个很好的例子是 Comparable
:
abstract class Comparable<in T> {
abstract fun compareTo(other: T): Int
}
fun demo(x: Comparable<Number>) {
x.compareTo(1.0) // 1.0 类型为 Double, 是 Number 的子类型
// 因此, 我们可以将 x 赋值给 Comparable<Double> 类型的变量
val y: Comparable<Double> = x // OK!
}
我们认为 in 和 out 关键字的意义是十分明显的(同样的关键字已经在 C# 中经常使用了), 因此, 前面提到的记忆口诀也没有必要了, 为了一种崇高的理念, 我们可以将它改写一下:
存在主义 变形法则: 消费者进去, 生产者出来! :-)
译注: 上面两句翻译得不够好, 待校
将声明类型参数 T 声明为 out, 就可以在使用时将它子类化, 这是十分方便的. 当我们的类 能够 局限为仅仅只返回 T
类型值的时候, 的确如此, 但如果不能呢?
关于这个问题, 一个很好的例子是 Array 类:
class Array<T>(val size: Int) {
fun get(index: Int): T { /* ... */ }
fun set(index: Int, value: T) { /* ... */ }
}
这个类对于类型参数 T
既不能协变, 也不能反向协变. 这就带来很大的不便. 我们来看看下面的函数:
fun copy(from: Array<Any>, to: Array<Any>) {
assert(from.size == to.size)
for (i in from.indices)
to[i] = from[i]
}
这个函数应该将元素从一个 Array 复制到另一个 Array. 我们来试试使用一下这个函数:
val ints: Array<Int> = arrayOf(1, 2, 3)
val any = Array<Any>(3)
copy(ints, any) // 错误: 期待的参数类型是 (Array<Any>, Array<Any>)
在这里, 我们又遇到了熟悉的老问题: Array<T>
对于类型参数 T
是 不可变的, 因此 Array<Int>
和 Array<Any>
谁也不是谁的子类型. 为什么会这样? 原因与以前一样, 因为 copy 函数 有可能 会做一些不安全的操作, 也就是说, 这个函数可能会试图向 from
数组中 写入, 比如说, 一个 String, 这时假如我们传入的实际参数是一个 Int
的数组, 就会导致一个 ClassCastException
.
所以, 我们需要确保的就是 copy()
函数不会做这类不安全的操作. 我们希望禁止这个函数向 from
数组 写入 数据, 我们可以这样声明:
fun copy(from: Array<out Any>, to: Array<Any>) {
// ...
}
这种声明在 Kotlin 中称为 类型投射(type projection): 我们声明的含义是, from
不是一个单纯的数组, 而是一个被限制(投射)的数组: 我们只能对这个数组调用那些返回值为类型参数 T
的方法, 在这个例子中, 我们只能调用 get()
方法. 这就是我们实现 使用处的类型变异(use-site variance) 的方案, 与 Java 的 Array<? extends Object>
相同, 但略为简单一些.
你也可以使用 in 关键字来投射一个类型:
fun fill(dest: Array<in String>, value: String) {
// ...
}
Array<in String>
与 Java 的 Array<? super String>
相同, 也就是说, 你可以使用 CharSequence
数组, 或者 Object
数组作为 fill()
函数的参数.
有些时候, 你可能想表示你并不知道类型参数的任何信息, 但是仍然希望能够安全地使用它.
这里所谓"安全地使用"是指, 对泛型类型定义一个类型投射, 要求这个泛型类型的所有的实体实例, 都是这个投射的子类型.
对于这个问题, Kotlin 提供了一种语法, 称为 星号投射(star-projection):
Foo<out T>
, 其中 T
是一个协变的类型参数, 上界(upper bound)为 TUpper
, Foo<*>
等价于 Foo<out TUpper>
. 它表示, 当 T
未知时, 你可以安全地从 Foo<*>
中 读取 TUpper
类型的值.Foo<in T>
, 其中 T
是一个反向协变的类型参数, Foo<*>
等价于 Foo<in Nothing>
. 它表示, 当 T
未知时, 你不能安全地向 Foo<*>
写入 任何东西.Foo<T>
, 其中 T
是一个协变的类型参数, 上界(upper bound)为 TUpper
, 对于读取值的场合, Foo<*>
等价于 Foo<out TUpper>
, 对于写入值的场合, 等价于 Foo<in Nothing>
.如果一个泛型类型中存在多个类型参数, 那么每个类型参数都可以单独的投射.
比如, 如果类型定义为 interface Function<in T, out U>
, 那么可以出现以下几种星号投射:
Function<*, String>
, 代表 Function<in Nothing, String>
;Function<Int, *>
, 代表 Function<Int, out Any?>
;Function<*, *>
, 代表 Function<in Nothing, out Any?>
.注意: 星号投射与 Java 的原生类型(raw type)非常类似, 但可以安全使用.
不仅类可以有类型参数. 函数一样可以有类型参数. 类型参数放在函数名称之前:
fun <T> singletonList(item: T): List<T> {
// ...
}
fun <T> T.basicToString() : String { // 扩展函数
// ...
}
调用泛型函数时, 应该在函数名称 之后 指定调用端类型参数:
val l = singletonList<Int>(1)
对于一个给定的类型参数, 所允许使用的类型, 可以通过 泛型约束(generic constraint) 来限制.
最常见的约束是 上界(upper bound), 与 Java 中的 extends 关键字相同:
fun <T : Comparable<T>> sort(list: List<T>) {
// ...
}
冒号之后指定的类型就是类型参数的 上界(upper bound): 对于类型参数 T
, 只允许使用 Comparable<T>
的子类型. 比如:
sort(listOf(1, 2, 3)) // 正确: Int 是 Comparable<Int> 的子类型
sort(listOf(HashMap<Int, String>())) // 错误: HashMap<Int, String> 不是 Comparable<HashMap<Int, String>> 的子类型
如果没有指定, 则默认使用的上界是 Any?
. 在定义类型参数的尖括号内, 只允许定义唯一一个上界.
如果同一个类型参数需要指定多个上界, 这时就需要使用单独的 where 子句:
fun <T> cloneWhenGreater(list: List<T>, threshold: T): List<T>
where T : Comparable,
T : Cloneable {
return list.filter { it > threshold }.map { it.clone() }
}