@boothsun 2017-06-14T01:14:49.000000Z 字数 2545 阅读 1820

ES Java 客户端

ES

Java 客户端

节点客户端(node client)：

节点客户端本身也是一个ES节点(一般不保存数据，不能成为主节点)，它能以无数据节点身份加入到集群中。因为它是集群环境中的一个节点，所以它知道整个集群状态(所有节点驻留，分片分布在哪些节点等等)，可以把需要执行的操作自动路由到节点上，而少一个网络跃点。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
GetResponse getResponse = client.prepareGet(index, type, "2").get();
System.out.println(JSONObject.toJSONString(getResponse));

当你启动node时，你可以在你的项目/src/main/resources/elasticsearch.yml文件中定义简单的设置cluster.name或者明确地使用clusterName方法来加入到指定的集群中。

使用elasticsearch.yml的方式

cluster.name: yourclustername

通过Java的方式

 Node node =  NodeBuilder.nodeBuilder().clusterName("elasticsearch").local(true).node() ;

使用节点客户端的好处是，操作可以自动地路由到这些操作被执行的节点，而不需要执行双跳(double hop)。例如，索引操作将会在该操作最终存在的分片上执行。

当你启动了一个节点，最重要的决定是它是否将保有数据。大多数情况下，我们仅仅需要用到clients，而不需要分片分配给它们。这可以通过设置node.data为false或者设置node.local为true来简单实现。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();

传输客户端(Transport Client)

作为更轻量的传输客户端能够请求到远程集群。它自己不加入集群，只是简单的获得一个或者多个初始化的transport地址，并以轮询的方式与这些地址进行通信。比较像传统的CS程序的架构，比如数据库连接。

Settings settings = Settings.builder().put("cluster.name", "my-application").build();
TransportClient transportClient = TransportClient.builder()
  .settings(settings)
  .build()
  .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("XXX.XXX.XXX.XXX"),   9300));

传输客户端可以嗅到集群的其他部分，并将它们加入到机器列表。为了开启该功能，可以设置client.transport.sniff为true。

其他的transfersport客户端设置有如下几个：

Parameter	Description
client.transport.ignore_cluster_name	true：忽略连接节点的集群名验证
client.transport.ping_timeout	ping一个节点的响应时间，默认是5s
client.transport.nodes_sampler_interval	sample/ping 节点的时间间隔，默认是5s

节点客户端与传输客户端的区别

第一种方式，相当于额外启动了一个ES的node节点，这个节点和集群中的其他节点没有任何区别。只是这个node是由我们编码控制的，可以设置这个node是不存数据的节点(没有特殊原因你就应该这个设置)。
第二种方法，相当于获取了所有node节点的client，发送请求的时候遍历当前可用的client(这里可用指的是可以连接，但是node本身不一定可用，比如node正在恢复中，还没有加入到集群，这就会产生问题。)跟方法一相比，方法二会产生双跳(double hop)，即当前遍历到node1，但访问的数据在node2，请求先转发到node1，又由node1转发到node2。
遍历方式：每次请求通过AtomicInteger进行原子加1(超过最大值后设置为0)，按当前可用client数取模。
获取当前可用client的方法：使用线程池，遍历当前可用client，如果client未连接，尝试进行一次连接，连接成功加入可用client中，如果client已经连接直接加入可用client。
可以通过设置client.transport.sniff是否为true，来设置是使用SimpleNodeSampler还是SniffNOdesSampler，默认是false，就是使用SimpleNodeSampler。具体实现在org.elasticsearch.client.transport.TransportClientNodesService中。
简单的说，SimpleNodeSampler会限制当前可用client一定是在配置中设置的节点。而SniffNodesSampler会使用所有发现的client，即使这个client的node，不在配置中。
当集群中某个node挂掉之后，重新加入的时候，因为是通过判断client是否可以连接，而不是node是否可用，这会导致这个时候使用这个client发送请求的时候产生异常。而方法一不会，因为还没加入集群的node，对于自己创建的node来说是不可见的。

使用情况

如果要将应用程序和Elasticsearch集群进行解耦，传输客户端是一个理想的选择。例如如果你的应用程序需要快速的创建和销毁到集群的链接，传输客户端比节点客户端更"轻"，因为它不是集群的

参考文档

Elasticsearch: 权威指南

elasticsearch 2种客户端的区别

客户端