[关闭]
@levinzhang 2017-12-12T16:09:43.000000Z 字数 12089 阅读 613

使用Akka Actor和Java 8构建反应式应用

by

on Jan 23, 2017

摘要:

在几年前,组合使用Akka和Java 8来创建基于微服务的分布式系统还是一个美梦。基于Actor的系统能够让开发人员创建快速演化的微服务架构,这种架构能够弹性扩展以应对大量的数据。


核心要点

尽管“反应式(reactive)”这个术语已经存在很长时间了,但是只有到最近它才被行业实际应用到系统设计之中,并得到了主流的采纳。在2014年Gartner就写到,过去非常流行的三层架构已经日薄西山。随着企业在推进现代化方面的努力,这一点已经越发明晰了,企业必须要重新思考他们十多年来构建应用的方式。

微服务席卷了软件行业,它所带来的冲击波正在从根本上动摇传统开发流程。我们看到软件设计范式发生了变化,项目管理的方法论也随之发生了演化。我们正在向新的应用设计和实现方式转变,它以前所未有的势头在IT系统中实现。即便微服务这个术语不是全新的概念,我们的行业也正在意识到它不仅仅是解耦RESTful端点和拆分单体应用,它真正的价值在于更好的资源利用效率以及面对不可预知工作负载时更强的扩展性。反应式宣言(Reactive Manifesto)的原则很快变成了微服务架构的圣经,因为它们本质上就是分布式的反应式应用。

如今应用中的Actor模型

为了保持用户的兴趣,应用必须要保持很高的响应性,同时,为了满足受众不断变化的需求和预期,应用必须要快速演化。用于构建应用的技术在不断地快速演进;科学在不断发展,持续涌现的新需求不能依赖于昨天的工具和方法论。Actor模型正在不断发展起来,它是一种构建应用的高效工具,能够充分发挥多核、内存以及集群环境所带来的强大处理能力。

Actor提供了一种简单却强大的模型,通过该模型设计和实现的应用可以分布式的,并且能够跨系统中所有的资源共享工作任务,这些资源可以从线程和核心级别一直到服务器集群和数据中心级别。它提供了一个高效的框架来构建应用,所构建出的应用具有较高的并发性,并且能够提升资源的利用率。另外很重要的一点,Actor模型还提供了定义良好的方式来优雅地处理错误和故障,确保应用的可靠性级别,它能够隔离问题,防止级联故障和长时间的宕机。

在过去,构建高并发的系统通常涉及到大量的装配和非常技术化的编程,它们都是非常难以掌握的。这些技术方面的挑战会抢占我们对系统核心业务功能的注意力,因为很大一部分的工作都集中在业务细节上,这需要花费很多的时间和精力用于搭建处理管道和功能装配。如果我们使用Actor来构建系统的话,就能在一个较高的抽象层级完成这些任务,因为处理管道和功能装配已经内置在了Actor模型之中。这不仅能够将我们从繁琐的传统系统实现的细节中解放出来,还能让我们更加关注于系统的核心功能和创新。

使用Java 8和Akka实现Actor模型

Akka是一个在JVM上构建高并发、分布式、有弹性的消息驱动应用的工具集。Akka “actor”只是Akka工具集中一部分,它能够让我们在编写并发代码时,不用去思考低层级的线程和锁。Akka中其他的工具还包括Akka Streams和Akka http。尽管Akka是使用Scala编写的,但是它也有Java API,如下的样例运行在2.4.9版本以上(目前Akka的最新版本为2.5.7,但核心API与本文基本相同——译者注)。

在Akka中,Actor是基本的工作单元。Actor是状态和行为的一个容器,它可以创建和监管子Actor。Actor之间通过异步的消息实现相互的通信。这个模型保护了Actor的内部状态,使其能够实现线程安全,该模型还实现了事件驱动的行为,从而不会阻塞其他的Actor。作为开始,我们所需要知道的只是akka的Maven依赖。

  1. <dependency>
  2. <groupId>com.typesafe.akka</groupId>
  3. <artifactId>akka-actor_2.11</artifactId>
  4. <version>2.4.9</version>
  5. </dependency>

改变Actor的状态

就像通过移动设备收发短信一样,我们需要使用消息来调用Actor。与短信类似,Actor之间的消息也必须是不可变的。在使用Actor的时候,最重要的就是定义它所能接受的消息。(这种消息通常被称为协议,因为它定义了Actor之间的交互点。)Actor接收消息,然后以各种方式对其作出反应,它们可以发送其他的消息、修改自己的状态或行为、创建其他的Actor。

Actor的初始行为是通过实现receive()方法来定义的,在实现这个方法时,可以在默认的constructor. receive()中借助ReceiveBuilder匹配传入的消息并执行相关的行为。每条信息的行为通过一个Lambda表达式来定义。在下面的样例中,ReceiveBuilder使用了对接口方法“onMessage”的引用。onMessage方法增加了一个计数器(内部状态)并通过AbstractLoggingActor.log方法记录了一条info级别的日志信息。

  1. static class Counter extends AbstractLoggingActor {
  2. static class Message { }
  3. private int counter = 0;
  4. {
  5. receive(ReceiveBuilder
  6. .match(Message.class, this::onMessage)
  7. .build()
  8. );
  9. }
  10. private void onMessage(Message message) {
  11. counter++;
  12. log().info("Increased counter " + counter);
  13. }
  14. }

Actor就绪之后,还需要启动它。这需要通过ActorSystem实现,它控制着Actor的生命周期。但是,我们首先需要提供一些关于如何启动这个Actor所需的额外信息。akka.actor.Props是一个配置对象,能够将上下文范围内的配置暴露给框架的各个地方。它用来创建我们的Actor,这个对象是不可变的,因此线程安全,完全可以共享。

return Props.create(Counter.class);

Props对象描述了Actor的构造器参数。将其封装到一个工厂函数中并放到Actor的构造器附近通常是一种好的实践。ActorSystem本身是在main方法中创建的。

  1. public static void main(String[] args) {
  2. ActorSystem system = ActorSystem.create("sample1");
  3. ActorRef counter = system.actorOf(Counter.props(), "counter");
  4. }

ActorSystem (“sample1”)和它所包含的Actor(“counter”)都可以给定名称,这样便于在Actor层级结构中进行导航,这个话题稍后会进行讨论。现在,ActorRef可以发送一条消息给Actor,如样例所示:

counter.tell(new Counter.Message(), ActorRef.noSender());

在这里,使用两个参数定义了要发送的Message以及消息的发送者。(顾名思义,noSender表明在本例中,并没有使用发送者。)如果运行上述样例的话,我们就能得到预期的输出:

[01/10/2017 10:15:15.400] [sample1-akka.actor.default-dispatcher-4] [akka://sample1/user/counter] Increased counter 1

这是一个非常简单的样例,但是它提供了我们所需的线程安全性。发送给Actor的消息来源于不同的线程,这些消息屏蔽了并发的问题,因为Actor框架会进行消息的序列化处理。读者可以在线查看完整的样例。

修改Actor的行为

读者可能已经注意到,我们的简单样例修改了Actor的状态,但是它并没有改变Actor行为,也没有发送消息给其他Actor。我们接下来考虑一个防盗报警系统,它可以通过密码来启用或禁用,它的传感器会探测活动。如果有人试图通过不正确的密码禁用告警的话,它就会发出声音。Actor能够响应三种消息,分别是通过密码(以负载的形式提供该值)进行禁用和启用的消息以及盗窃活动的消息。这三种消息都包含在了下面的协议中:

  1. static class Alarm extends AbstractLoggingActor {
  2. // contract
  3. static class Activity {}
  4. static class Disable {
  5. private final String password;
  6. public Disable(String password) {
  7. this.password = password;
  8. }
  9. }
  10. static class Enable {
  11. private final String password;
  12. public Enable(String password) {
  13. this.password = password;
  14. }
  15. }
  16. // ...
  17. }

Actor有一个针对密码的预置属性,它也会传入到构造器中:

  1. private final String password;
  2. public Alarm(String password) {
  3. this.password = password;
  4. // ...
  5. }

前面提到的akka.actor.Props配置对象也需要知道password属性,这样的话,才能在Actor系统启动的时候将其传递给实际的构造器。

  1. public static Props props(String password) {
  2. return Props.create(Alarm.class, password);
  3. }

针对每种可能的消息,Alarm还需要对应的行为。这些行为是AbstractActorreceive方法的实现。receive方法应该定义一系列的match语句(每个都是PartialFunction<Object, BoxedUnit>类型),它定义了Actor能够处理的消息,另外还包含消息如何进行处理的实现。

  1. private final PartialFunction<Object, BoxedUnit> enabled;
  2. private final PartialFunction<Object, BoxedUnit> disabled;

如果这个签名看上去令人望而生畏的话,那么我们的代码可以通过前面所使用的ReceiveBuilder将细节隐藏起来。

  1. public Alarm(String password) {
  2. this.password = password;
  3. enabled = ReceiveBuilder
  4. .match(Activity.class, this::onActivity)
  5. .match(Disable.class, this::onDisable)
  6. .build();
  7. disabled = ReceiveBuilder
  8. .match(Enable.class, this::onEnable)
  9. .build();
  10. receive(disabled);
  11. }
  12. }

需要注意最后对receive的调用,将默认行为设置为“disabled”。这三个行为是使用已有的三个方法(onActivity、onDisable、onEnable)来实现的。这些方法中最简单的是onActivity。如果接收到activity的话,报警会在控制台记录一条日志。在这里需要注意activity没有消息负载,所以我们将其命名为ignored。  

  1. private void onActivity(Activity ignored) {
  2. log().warning("oeoeoeoeoe, alarm alarm!!!");
  3. }

如果Actor接收到一条enable消息的话,新的状态将会记录下来并且状态将会变更为enabled。如果密码不匹配的话,会记录一条简短的警告日志。消息负载现在包含了密码,所以我们可以通过访问它来校验密码。

  1. private void onEnable(Enable enable) {
  2. if (password.equals(enable.password)) {
  3. log().info("Alarm enable");
  4. getContext().become(enabled);
  5. } else {
  6. log().info("Someone failed to enable the alarm");
  7. }
  8. }

当收到一条disable消息时,Actor需要检查密码,记录一条关于状态变化的简短消息然后将状态修改为disabled或者在密码不匹配的情况下记录一条警告信息。

  1. private void onDisable(Disable disable) {
  2. if (password.equals(disable.password)) {
  3. log().info("Alarm disabled");
  4. getContext().become(disabled);
  5. } else {
  6. log().warning("Someone who didn't know the password tried to disable it");
  7. }
  8. }

这样就完成了Actor的逻辑,我们接下来可以启动Actor系统并向其发送一些消息。注意,我们的正确密码“cats”是作为一个属性传递给Actor系统的。

  1. ActorSystem system = ActorSystem.create();
  2. final ActorRef alarm = system.actorOf(Alarm.props("cat"), "alarm");

消息:

  1. alarm.tell(new Alarm.Activity(), ActorRef.noSender());
  2. alarm.tell(new Alarm.Enable("dogs"), ActorRef.noSender());
  3. alarm.tell(new Alarm.Enable("cat"), ActorRef.noSender());
  4. alarm.tell(new Alarm.Activity(), ActorRef.noSender());
  5. alarm.tell(new Alarm.Disable("dogs"), ActorRef.noSender());
  6. alarm.tell(new Alarm.Disable("cat"), ActorRef.noSender());
  7. alarm.tell(new Alarm.Activity(), ActorRef.noSender());

产生的输出如下所示:

  1. [01/10/2017 10:15:15.400] [default-akka.actor.default-dispatcher-4] [akka://default/user/alarm] Someone failed to enable the alarm
  2. [01/10/2017 10:15:15.401] [default-akka.actor.default-dispatcher-4] [akka://default/user/alarm] Alarm enable
  3. [WARN] [01/10/2017 10:15:15.403] [default-akka.actor.default-dispatcher-4] [akka://default/user/alarm] oeoeoeoeoe, alarm alarm!!!
  4. [WARN] [01/10/2017 10:15:15.404] [default-akka.actor.default-dispatcher-4] [akka://default/user/alarm] Someone who didn't know the password tried to disable it
  5. [01/10/2017 10:15:15.404] [default-akka.actor.default-dispatcher-4] [akka://default/user/alarm] Alarm disabled

你可以在GitHub上找到完整的可运行样例。到目前为止,我们只使用了一个Actor来处理消息。不过就像在业务组织中一样,Actor也能形成自然的层级结构。

Actor的层级结构

Actor可能会创建其他的Actor。当一个Actor创建另外一个Actor时,创建者也被称为监管者(supervisor),而被创建的Actor也被称为工作者(worker)。我们可能基于很多原因需要创建工作者Actor,最常见的原因是工作的委托。监管者创建一个或多个工作者Actor,然后将工作委托给它们。

监管者同时会成为工作者的看守人。就像父母会时刻关注孩子的行为那样,监管者也会照顾它的工作者Actor。如果Actor遇到问题的话,它会将自己挂起(也就是说在恢复之前,它不会处理正常的消息),并且会通知其监管者自己发生了故障。

到目前为止,我们创建了多个Actor并为其分配了名字。Actor的名字用来在层级结构中识别Actor。与Actor交互的一般都是用户所创建Actor的父Actor,也就是带有"/user"路径的guardian。使用原始system.actorOf()创建的Actor是该guardian的直接子Actor,如果它终止的话,系统中所有正常的Actor也都会关闭。在上面的alarm样例中,我们创建的是/user/alarm路径的用户Actor。因为Actor是按照严格的层级方式来创建的,所以Actor会存在一个由Actor名称组成的唯一序列,这个序列会从Actor系统的根逐级往下,按照父子关系形成。这个序列类似于文件系统中的封闭文件夹,因此采用了“路径(path)”这个名称来代指它,当然Actor层级结构与文件系统的层级结构还有一些基础的差异。

在Actor内部,我们可以调用getContext().actorOf(props, “alarm-child”)创建名为“alarm-child”的新Actor,它会作为alarm Actor的子Actor。子Actor的生命周期是绑定在父Actor之上的,这意味着如果我们停止“alarm” Actor的话,也会停掉其子Actor:

这种层级结构对于基于Actor系统的故障处理也有着直接影响。Actor系统的典型特点就是将任务进行分解和委托,直到它被拆分得足够小,能够从一个地方进行处理。通过这种方式,不仅任务本身能够非常清晰地进行结构化,所形成的Actor也能在如下方面变得非常明确:

如果某个Actor无法处理特定情景的话,它会发送对应的故障消息给它的监管者,请求帮助。面对故障,监管者有四种不同的可选方案:

接下来,我们将上面学到的所有内容通过一个样例来具体讲解一下:NonTrustWorthyChild接收Command消息,每当收到该消息时,会增加一个内部的计数器。如果消息数能够被4整除的话,会抛出一个RuntimeException,这个异常会向上传递给Supervisor。这里并没有什么新东西,Command消息本身并没有负载。

  1. public class NonTrustWorthyChild extends AbstractLoggingActor {
  2. public static class Command {}
  3. private long messages = 0L;
  4. {
  5. receive(ReceiveBuilder
  6. .match(Command.class, this::onCommand)
  7. .build()
  8. );
  9. }
  10. private void onCommand(Command c) {
  11. messages++;
  12. if (messages % 4 == 0) {
  13. throw new RuntimeException("Oh no, I got four commands, can't handle more");
  14. } else {
  15. log().info("Got a command " + messages);
  16. }
  17. }
  18. public static Props props() {
  19. return Props.create(NonTrustWorthyChild.class);
  20. }
  21. }

Supervisor 在它的构造器中启动NonTrustWorthyChild,并将它所接收到的command消息直接转发给子Actor。

  1. public class Supervisor extends AbstractLoggingActor {
  2. {
  3. final ActorRef child = getContext().actorOf(NonTrustWorthyChild.props(), "child");
  4. receive(ReceiveBuilder
  5. .matchAny(command -> child.forward(command, getContext()))
  6. .build()
  7. );
  8. }
  9. //…
  10. }

Supervisor实际启动之后,所形成的层级结构将会是“/user/supervisor/child”。在我们完成该任务之前,需要预先定义所谓的监管策略(supervision strategy)。Akka提供了两种类型的监管策略:OneForOneStrategyAllForOneStrategy。它们之间的差异在于前者会将指令应用于发生故障的子Actor,而后者则会将指令同时应用于子Actor的兄弟节点。正常情况下,我们应该使用OneForOneStrategy,如果没有明确声明的话,它也是默认方案。监管策略需要通过覆盖SupervisorStrategy方法来定义。

  1. @Override
  2. public SupervisorStrategy supervisorStrategy() {
  3. return new OneForOneStrategy(
  4. 10,
  5. Duration.create(10, TimeUnit.SECONDS),
  6. DeciderBuilder
  7. .match(RuntimeException.class, ex -> stop())
  8. .build()
  9. );
  10. }

第一个参数定义了maxNrOfRetries,它指定了子Actor在停止之前允许尝试重启的次数。(如果设置为负数值,则代表没有限制)。withinTimeRange参数定义了maxNrOfRetries的持续时间窗口。按照上面的定义,该策略会在10秒钟之内尝试10次。DeciderBuilder的工作方式与ReceiveBuilder完全类似,它定义了要匹配的异常以及如何应对。在本例中,如果在10秒钟内尝试了10次的话,Supervisor会停止掉NonTrustWorthyChild,所有剩余的消息将会发送至dead letter box。

Actor系统是通过Supervisor Actor来启动的。

  1. ActorSystem system = ActorSystem.create();
  2. final ActorRef supervisor = system.actorOf(Supervisor.props(), "supervisor");

当系统启动之后,我们发送10条command信息到Supervisor。需要注意,“Command”消息是定义在NonTrustWorthyChild中的。

  1. for (int i = 0; i < 10; i++) {
  2. supervisor.tell(new NonTrustWorthyChild.Command(), ActorRef.noSender());
  3. }

输出的内容显示,在四条消息之后,异常传递到了Supervisor中,剩下的消息发送到了deadLetters收件箱中。如果SupervisorStrategy被定义为restart()而不是stop()的话,那么将会启动一个新的NonTrustWorthyChild Actor实例。

  1. [01/10/2017 12:33:47.540] [default-akka.actor.default-dispatcher-3] [akka://default/user/supervisor/child] Got a command 1
  2. [01/10/2017 12:33:47.540] [default-akka.actor.default-dispatcher-3] [akka://default/user/supervisor/child] Got a command 2
  3. [01/10/2017 12:33:47.540] [default-akka.actor.default-dispatcher-3] [akka://default/user/supervisor/child] Got a command 3
  4. [01/10/2017 12:33:47.548] [default-akka.actor.default-dispatcher-4] [akka://default/user/supervisor] Oh no, I got four commands, I can't handle any more
  5. java.lang.RuntimeException: Oh no, I got four commands, I can't handle any more
  6. ...
  7. [01/10/2017 12:33:47.556] [default-akka.actor.default-dispatcher-3] [akka://default/user/supervisor/child] Message [com.lightbend.akkasample.sample3.NonTrustWorthyChild$Command] from Actor[akka://default/deadLetters] to Actor[akka://default/user/supervisor/child#-1445437649] was not delivered. [1] dead letters encountered.

这个日志可以关闭或者进行调整,这需要修改 “akka.log-dead-letters”“akka.log-dead-letters-during-shutdown”的配置。

读者可以在线查看完整的样例,并尝试调整SupervisorStrategy

总结

借助Akka和Java 8,我们能够创建分布式和基于微服务的系统,这在几年前还是一种梦想。现在,所有行业的企业都迫切希望系统的演化速度能够跟上业务的速度和用户的需求。如今,我们能够弹性的扩展系统,使其支持大量的用户和庞大的数据。我们创建的系统有望具备一定级别的弹性,使停机时间不再是按照小时来计算,而是按照秒来计算。基于Actor的系统能够让我们创建快速演进的微服务架构,它可以进行扩展并且能够不停机运行。

Actor模型提供了反应式系统的核心功能,也就是反应式宣言所定义的响应性、弹性、扩展性以及消息驱动。

Actor系统可以进行水平扩展,从一个节点扩展到具有众多节点的集群,这样的话就为我们提供了灵活性以应对大规模的负载。除此之外,还可能实现有弹性的扩展,也就是扩展系统的处理能力,不管是手动的还是自动的,都能充分支持系统活动所出现的高峰和低谷状态。

借助Actor和Actor系统,故障探测和恢复就成为一种架构上的特性,而不是事后才考虑增补上去的功能。我们可以使用内置的Actor监管策略来处理下属工作者Actor遇到的问题,能够一直向上追溯到Actor系统层级,集群节点会积极监控集群的状态,在这种环境中处理故障已经植入到了Actor和Actor系统的DNA之中了。这其实始于Actor之间异步交换消息的最基础层级:如果你给我发送一条消息的话,你必须要考虑可能的输出,如果得到了预期的答复该怎么办,没有收到预期答复又该怎么办?这种处理策略会一直延伸到集群中节点的加入和离开。

在设计系统时,按照Actor的方式思考在很多方面都会更加直观。Actor的交互方式对我们来说会更加自然,因为简单来讲,它的交互方式与人类之间的交互方式更加接近。这样的话,我们在设计和实现系统时,能够更加关注核心功能,忽略其他业务不相关的冗余内容。

关于作者

Markus Eisele是一位Java Champion、前Java EE专家组成员、JavaLand的创始人,在世界范围内的Java会议上是享有盛誉的讲师,在企业级Java领域颇为知名。他在Lightbend担任开发人员,读者可以在Twitter上@myfear联系到他。

查看英文原文:Building Reactive Applications with Akka Actors and Java 8

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注