@levinzhang
2021-01-11T23:07:05.000000Z
字数 6587
阅读 705
本文首先阐述了RESTful风格API的基础理论知识以及Richardson成熟度模型,随后讨论了良好的API应该具有哪些特征,最后对流行的API实现方式,即GraphQL和RESTful,进行了对比。
本文最初发表于STX Next博客网站,经原作者Sebastian Buczyński同意由InfoQ中文站翻译分享。
现在,每个人都在关注API。API最早开始流行于大约20年前,2000年,Roy Fielding在他的博士论文中首次提出了REST这个术语。同年,Amazon、Salesforce和eBay向全世界的开发者介绍了他们的API,永远改变了我们构建软件的方式。
在REST之前,Roy Fielding论文中的原则被称为“HTTP对象模型”,随后你会明白这为何非常重要。
随着阅读的深入,你还会看到如何确定你的API是否成熟,好API的主要品质是什么以及为何在构建API的时候,要注重适应性。
REST代表表述性状态转移(Representational State Transfer),由Roy Fielding在他的博士论文中定义,长期以来,它就是服务API的圣杯。它并不是构建API的唯一方式,但是由于它的流行,即便是非开发人员也知道这种标准。
RESTful软件有如下六种特点:
但是,对于日常使用来说,这过于理论化了。我们需要更具操作性的东西,这也就是API成熟度模型。
该模型是由Leonard Richardson提出的,它将RESTful开发原则结合成了四个简单易行的步骤。
在模型中的位置越高,就越接近Roy Fielding所定义的RESTful原始理念。
Level 0的API是一组简单XML或JSON的描述。在前文中,我曾经说过在Fielding的论文之前,RESTful原则被称为“HTTP对象模型”。
这是因为HTTP是RESTful开发中最重要的组成部分。REST要尽可能多地使用HTTP固有属性中的理念。
在Level 0,没有使用任何这样的东西。我们只是构建自己的协议并把它作为一个专有层。这种架构被称为远程过程调用(Remote Procedure Call,RPC),适用于远程过程/命令。
通常我们会有一个端点,可以对它进行调用以获取一堆XML。在这方面,一个典型的例子就是SOAP协议:
另外一个很好的例子就是Slack API。它有些多样化,有多个端点,但依然是RPC风格的API。它暴露了Slack的各种功能,中间没有附加任何特性。如下的代码展示了如何向一个特定的通道发送消息:
虽然按照Richardson的模型,这是一个Level 0的API,但是这并不意味着它是不好的。只要它是可用的,并且恰当地服务于业务需求,那它就是很棒的API。
为了构建Level 1的API,我们需要找出系统中的名词并将它们通过不同的URL暴露出来,如下面的样例所示:
其中,“/api/books”能够让我访问一个通用的图书目录,“/api/profile”能够让我访问这些书的作者的基本信息。为了获取某个资源的第一个特定实例,我可以在URL中添加ID(或其他引用)。
在URL中还可以嵌套资源,这展示了它们是以层级结构的形式组织的。
回到Slack的样例,如下展示了按照Level 1 API,它们会是什么样子的:
现在,URL发生了变化,从原先的“/api/chat.postMessage”变成了现在的“/api/channels/general/messages”。
信息中“channel”部分从请求体转移到了URL中。从字面就能看出,通过使用这个URL,我们可以预期有条消息发布到了“general”通道上。
Level 2利用HTTP动作(verb)来添加更多的含义和意图。在这方面可用的动作比较多,我这里只用到一个基础的子集:PUT / DELETE / GET / POST。
借助这些动作,我们可以预期包含它们的URL有不同的行为:
以上面提到的“/api/books”为例:
那这里的“安全”和“幂等”又是什么意思呢?
“安全”的方法指的是永远不会改变数据的方法。REST建议GET方法只能用来获取数据,所以在上面的集合中,它是唯一一个安全的方法。不管你调用多少次基于REST的GET方法,它永远不会改变数据库中的任何东西。但是,这并不是该动作的固有特性,而是关系到你该如何实现它,所以我们需要确保它是这样运行的。所有其他的方法都会以不同的方式改变数据,不能随意使用。在REST中,GET方法既是安全的,又是幂等的。
“幂等”的方法指的是多次使用不会产生不同结果的方法。按照REST,DELETE方法应该是幂等的,如果删除了某个资源,然后针对相同的资源再次调用DELETE,它不会改变任何东西。资源应该早就已经消失了。在REST规范中,POST是唯一一个非幂等的方法,所以我们可以对相同的资源多次调用POST方法,这样我们会得到重复的资源。
我们重新看一下Slack样例,如果我们使用HTTP动作来进行更多的操作会是什么样子:
我们可以使用POST方法发送消息到通用的通道,我们也可以使用GET方法从通用通道获取消息。我们还可以使用DELETE方法和特定的ID删除消息,这里比较有意思的一点在于,消息并不是与特定通道关联的,所以我可以设计一个单独的API来删除资源。这个例子表明,设计API并不总是那么简单,这方面有很多可选项和权衡。
还记得纯文字、没有任何图像的电脑游戏吗?我们只能看到一些文本,描述了你在哪里,以及接下来能够干什么。为了取得进展,我们必须要输入自己的选择。在一定程度上来讲,HATEOAS就是做这件事情的。
HATEOAS指的是“超媒体作为应用状态引擎(Hypermedia as the Engine of Application State)”。
有了HATEOAS之后,当其他人使用你的API的时候,他们就能看到通过API还能做哪些其他的事情。HATEOAS回答了“从这里出发,我还能去哪里?”的问题。
但这还不是所有的内容。HATEOAS还可以对数据关系进行建模。我们可能会有一个关于图书的资源,并且在URL中没有将作者信息嵌套进来,但是我们可以包含它们的链接,如果有人对作者感兴趣的话,那么他们可以访问这些链接并探索相关的数据。
HATEOAS不像其他成熟度模型的等级那样流行,但是有些开发人员确实在使用它。其中一个样例就是Jira,如下是它们的搜索API的响应:
他们将链接嵌入到了其他我们可以探索的资源中,以及该issue的状态过渡列表。
另外一个使用HATEOAS的样例是Artsy。他们的API严重依赖HATEOAS,并且还使用了JSON Plus调用规范,按照该规范强制要求使用一种特殊的约定来构建链接。下面是一个分页的例子,这是使用HATEOAS最酷的样例之一:
我们可以提供到下一页、上一页、第一页和最后一页的链接,还可以按照需要添加其他页面的链接。这样简化了API的消费,因为这样不需要在客户端添加URL的解析逻辑,也不需要追加页码的方法。我们只需要在客户端使用已经实现结构化的链接就可以了。
我们已经介绍完了Richardson模型,但这并不是实现好的API的全部内容。其他重要的品质还有什么呢?
我对自己所使用的API的基本期望之一就是,需要有一种明确的方式来判断是否有错误或异常。我想要知道我的请求是否得到了处理。
HTTP有一种简单的方式来实现这一点:HTTP状态码。
管理状态码的基本规则是:
我们的API至少要提供4xx和5xx状态码。有时候,5xx是自动生成的。例如,客户端发送了一些内容到服务器端,但是这是非法的请求,而我们的校验是有缺陷的,从而导致这个问题继续在代码中执行了下去,最终导致出现了异常,这样就会返回一个5xx的状态码。
如果你想要承诺使用特定的状态码,那么你会遇到“哪种状态码最适合当前情况?”的问题。这样的问题并不总是那么容易回答,我推荐你去阅读声明这些状态码的RFC,它们给出了比其他来源更广泛的解释,并且告诉了你何时使用这些状态码更合适等。幸运的是,网上有些资源可以帮助我们做出选择,比如Mozilla的HTTP状态码指南。
优秀的API必须要有优秀的文档。在文档方面,最大的问题在于,随着API的发展需要找人同步更新文档。有个更好的方案是不脱离代码自更新文档。
例如,注释与代码的脱节。当代码发生变化的时候,注释依然保持不变,这样的话,注释就过时了。这甚至会比根本就没有任何注释更糟糕,因为在随后的一段时间内,它们会提供错误的信息。注释不会自动更新,所以开发人员需要记得在维护代码的时候同时维护它们。
自更新的文档工具可以解决这个问题。在这方面,一个流行的工具就是Swagger,它是基于OpenAPI构建的工具,能够很容易地描述你的API。
Swagger很酷的一点在于它是可执行的,所以如果你尝试修改API,能够立即看到它的作用和变化。
为了给Swagger添加自动更新功能,我们需要使用其他的插件和工具。在Python中,有针对大多数主流框架的插件。它们能够生成API请求该如何组织的描述,并定义数据的输入和输出。
如果你不想要使用Swagger,而是想使用更简单的工具,那该怎么办呢?有个流行的替代方案是Slate。
还有一些值得推荐的中间方案,如widdershins和api2html的组合,它允许我们从Swagger的定义中生成类似Slate的文档。
在有些系统中,缓存可能并不是什么大问题。这样的系统可能没有很多的数据可供缓存,所有的数据都在不断地发生变化,或者系统根本没有很大的流量。
但是,在大多数情况下,缓存对于良好的性能至关重要。它与RESTful API密切相关,因为HTTP协议在缓存方面做了很多的事情,比如HTTP头信息允许我们控制缓存的行为。
你可能想要在客户端缓存东西,或者如果有注册表或值存储的话,那么你可能想要在应用程序中缓存数据。但是,HTTP让我们能够基本上免费就可以获得一个很好的缓存,所以如果可能的话,请不要错过这个免费的午餐。
同时,因为缓存是HTTP规范的一部分,所以很多涉及HTTP的技术都知道如何进行缓存:浏览器原生支持缓存,客户端和服务器之间的中间技术也是如此。
构建API以及现代软件最重要的部分就是适应性。如果没有适应性,开发就会变慢,在合理的时间发布特性就会变得更加困难,当面对最后截止时间的时候更是如此。
“软件架构”在不同的上下文语境中有不同的含义,不过我们现在采用这个定义:
软件架构一种行为/艺术,能够避免会阻碍未来变化的决策。
记住了这一点,在设计软件的时候,当你必须要在具有相似优点的方案中做出选择时,你应该始终选择更多考虑到未来的方案。
好的实践并不是万能的。按照正确的方式构建错误的东西并不是你想要的结果。最好采取一种成长的心态,接受变化是不可避免的,尤其是如果你的项目要持续发展的话更是如此。
要想让你的API更具适应性,其中很关键的一点就是保持尽可能薄的API层,真正的复杂性应该往下层转移。
公开的API发布之后,它就已经完成了,是不可改变的,你就不能再去触碰它了。如果你已经有了一个设计古怪的API,除了接受现状之外,还能做些什么呢?
你应该不断寻找简化实现的方法。有时候,你可以通过一个特定的HTTP头信息来控制API响应的格式,相对于构建另外一个叫做v2的新API,这是一种更简单的解决方案。
API只是另外一层的抽象。它们不应该决定如何实现,为了避免这种问题,我们可以采用如下几种开发模式。
这是一种类似于门面的开发模式。如果你要把一个单体结构拆分为一组微服务,并且希望向外部暴露一些功能的话,那么你只需要构建一个类似门面的API网关。
它将为不同的微服务提供一个统一的接口(这些微服务可能有不同的API,使用不同的错误格式等等)。
如果你必须要构建一个API来满足一堆不同的客户端的话,那么这可能会非常困难。针对某个客户端所作出的决策可能会影响其他客户端的功能。
按照适用于前端的后端(backend for frontend)理念,如果你有不同的客户端,它们喜欢不同形式的API,比如移动应用可能会喜欢使用GraphQL,那么就单独为它们构建吧。
只有当你的API是一层抽象,并且这个抽象层很薄的时候,这种方式才有效。如果它与你的数据库耦合,或者太大,具有太多的逻辑,那么就无法这样做了。
很多人都在热炒GraphQL。它是一项新兴的技术,但是已经有了很多的粉丝,以至于有些开发者声称它将取代REST。
尽管GraphQL比RESTful要新的多,但是它们有很多相似之处。GraphQL最大的不足之处在于它的缓存,它必须要在客户端或应用程序中实现。现在,有内置的实现了缓存功能的客户端库(比如Apollo),但是这仍然要比使用HTTP提供的几乎免费的缓存功能要困难。
从技术讲,GraphQL位于Richardson模型的Level 0层级,但是它具有良好API的特质。我们可能无法同时使用多个HTTP的功能,但是GraphQL的出现就是解决这一问题的。
GraphQL的杀手锏就是聚合不同的API,并将它们作为一个GraphQL API暴露出来。
GraphQL在处理数据抓取不足和数据过量抓取方面有很好的效果,而这些问题是REST API很难进行管理的。这两个问题都与性能有关,如果数据抓取不足,那说明你没有高效地使用API,所以必须要进行大量的调用。如果数据过量抓取的话,那么API调用的数据传输会比必要的数据传输更大,这是对带宽的一种浪费。
借助REST与GraphQL的比较,我们能够总结出一个好的API最重要的品质。
好的API的特性
对比项 | RESTful+扩展 | GraphQL |
---|---|---|
清晰的数据表述 | 资源 | 模式 |
操作 | 资源+HTTP动作 | 查询&Mutation&订阅 |
明确的方式告知是否存在错误/异常状况 | HTTP状态码 | “error”属性 |
发现&是否可导航 | HATEOAS | 模式,graphiql |
[可执行的]文档 | Swagger/Slate等 | 具备 |
缓存 | HTTP头信息 | 只能在应用或客户端级别实现 |
我们需要一个清晰的数据表述方式:RESTful以资源的方式提供了表述。
我们需要有一种方式显示有哪些可用的操作:RESTful通过组合资源和HTTP动作实现这一点。
我们需要有一种方式来确认是否存在错误/异常:HTTP状态码可以实现这一点,可能还会包含阐述它们的响应信息。
最好能够提供API发现和导航的功能:在RESTful中,HATEOAS负责实现这一点。
有好的文档是非常重要的:在这方面,可执行、自更新的文档可以解决这个问题,这超出了RESTful规范的范围。
最后,但同样重要的是,优秀的API应该具有缓存功能,除非你的特定情况认为它是不必要的。
REST和GraphQL之间最大的区别是它们处理缓存性的方式。当我们使用REST方式构建API的时候,我们基本上可以免费获得HTTP的缓存功能。如果选择GraphQL的话,你需要自行负责为客户端或应用程序添加缓存。
本文的内容基于Sebastian Buczyński的演讲,你可以查看他的博客Breadcrumbs Collector以及他的电子书Implementing the Clean Architecture。
关于API的更多信息,请参阅Phillip Sturgeon的博客或者他的一本优秀图书,名为:Build APIs You Won't Hate。