@ruoli 2017-03-18T07:45:07.000000Z 字数 8956 阅读 4194

ElasticSearch_1.7.1

其他开源框架

此处对应版本ElasticSearch_1.7.1，windows 平台。

ElasticSearch_1.7.1

1、ES安装

系统准备：
ES1.7.1，需要Jdk1.7.55+ 或Jdk1.8.20+ 支持。
从官方下载ES1.7.1，地址如下：

https://www.elastic.co/downloads/past-releases/elasticsearch-1-7-1

下载后，解压,双击 elasticsearch-1.7.1\bin\elasticsearch.bat即可运行。
启动完成后，访问 http://localhost:9200/，若出现ElasticSearch基础状态信息，则说明安装成功。

ElasticSearch 默认不允许跨域访问，如需跨域，则需要如下配置：
修改配置文件 elasticsearch-1.7.1\config\elasticsearch.yml
在最后顶格添加配置：http.cors.enabled: true

2、Head插件安装

Head插件是一个elasticsearch的集群管理工具，是elasticsearch的一个可视化客户端。

在elasticsearch-1.7.1\bin目录下开启命令行，运行如下命令：

plugin -install mobz/elasticsearch-head

即可自动安装
安装完成后，即可访问Head插件主页：

http://localhost:9200/_plugin/head

3、BigDesk插件安装

bigdesk是elasticsearch的一个集群监控工具，可以通过它来查看集群的各种状态，如：CPU，内存使用情况，索引数据，搜索情况，http连接数等，安装方法如下：

在elasticsearch-1.7.1\bin目录下开启命令行，运行如下命令：

plugin -install lukas-vlcek/bigdesk/2.5.0

即可自动安装
安装完成后，即可访问Head插件主页：

http://localhost:9200/_plugin/bigdesk

4、Marvel插件的安装

Marvel也是elasticsearch的一个管理监控工具，集head和bigdesk的优点与一身，Marvel是收费软件，安装方法如下：
在elasticsearch-1.7.1\bin目录下开启命令行，运行如下命令：

plugin -install elasticsearch/marvel/latest

即可自动安装
安装完成后，即可访问Head插件主页：

http://localhost:9200/_plugin/marvel

也可离线安装，下载安装包：

marvel-1.3.1.zip1954.5kB

下载后，解压到elasticsearch-1.7.1\plugins，并且将文件夹重命名为：marvel，重启 elasticsearch即可。

5、索引的CRUD操作

1、索引的增加

以下所有操作均使用Marvel插件来操作。
初始化索引，在创建索引时需要同时指定shareds碎片数量和replicas备份数量，创建library索引代码如下：

PUT http://localhost:9200/library/
{
    "setting":{
        "index":{
            "number_of_shards":5,
            "number_of_replicas":1
        }
    }
}

2、索引的查询

可以通过GET，带上_settings可以获取该索引的详细配置信息

GET /library/_settings

同时获取两个索引的信息

GET /library,library1/_settings

获取所有索引的信息

GET /_all/_settings

删除指定索引

DELETE /library

6、对文档的操作

1、创建一条文档记录

#        -----索引名称
#        |     -----type名称
#        |     |   ----文档ID
#        |     |   |    
#        |     |   |
#        |     |   |
#        |     |   |
#        |     |   |
#        |     |   |
PUT /library/books/1
{
    "title":"Elasticsearch:the definitive guide",
    "name":{
        "first":"zachary",
        "last":"tong"
    },
    "publish_date":"2017-02-19",
    "price":"49.99"
}

注意：如果创建文档时，不指定id，则ES会自动分配一个UUID。

2、查询一条文档记录

GET /library/books/1

3、通过 _source 获取指定字段

#获取一个字段
GET /library/books/1?_source=title
#获取两个字段
GET /library/books/1?_source=title,price
#获取所有字段
GET /library/books/1?_source

4、对文档进行更新操作

POST /library/books/1/_update
{
  "doc":{
    "price":10
  }
}

5、删除一个文档

DELETE /library/books/1
#删除类型
DELETE /library/books

7、批量获取多个文档

Multi GET API
可以更快更迅速的检索多个文档。
Mget API 参数是一个 docs数组，数组的每一个节点定义一个文档的 _index、_type、_id元数据。如下所示，其中 _source 为可选字段，用于指定要查询的列信息。

1、获取不同Index的信息

GET /_mget
{  
  "docs":[  
    {  
      "_index":"library",  
      "_type":"books",  
      "_id":1
    },  
    {  
      "_index":"library",  
      "_type":"books",  
      "_id":2,
      "_source":"title"
    }   
   ,
    {  
      "_index":"library",  
      "_type":"books",  
      "_id":2,
      "_source":["title","price"]
   }  
 ]  
}

2、获取相同Index下，相同Type下,不同ID的文档

GET /library/books/_mget
{
  "docs":[
    {"_id":1},
    {"_type":"books","_id":2}
    ]
}

简便方法：

GET /library/books/_mget
{
  "ids":["1","2"]
}

8、对文档内容的批量操作

批量操作的API:bulk
可以实现同时对多个文档的 create，update，delete。

请求体格式：

{action：{metadata}}\n
{request body}\n
{action：{metadata}}\n
{request body}\n

其中 action包括如下内容：
create：当文档不存在时进行创建
index：创建新文档或替换旧文档
update：局部更新一个文档
delete：删除一个文档

注意：对文档进行批量操作时，不能进行美化代码操作，其是根据换行来区分数据的。

具体示例代码如下：

POST /library/books/_bulk
  {"index":{"_id":1}}
  {"title":"Elasticsearch the definitive guide1","price":49}
  {"index":{"_id":2}}
  {"title":"Elasticsearch the definitive guide2","price":59}

当 action 为 delete时，没有request body信息，如下

POST /library/books/_bulk
  {"delete":{"_id":1}}
  {"delete":{"_id":2}}

update 操作，示例如下：

POST /library/books/_bulk
{"update":{"_id":1}}
{"doc":{"price":18}}
{"update":{"_id":2}}
{"doc":{"price":28}}

所有 create、index、update、delete 可以组合一起使用

9、搜索查询入门

1、简单查询

指定Index、指定 Type 的搜索

GET /library/books/_search?q=title:definitive

指定Index、不指定 Type 的搜索

GET /library/_search?q=title:definitive

不指定Index、不指定 Type 的搜索

GET /_search?q=title:definitive

2、Term查询和Terms查询

Term查询某个字段中有某个关键词的文档

GET /library/books/_search
{
  "query": {
    "term": {
        "title": "definitive"
    }
  }
}

Terms 查询某个字段中有多个关键字的文档，minimun_match:最小匹配集，若值为1，则代表关键词里最少出现一个，若值为2，则代表关键词里最少出现两个

GET /library/books/_search
{
  "query": {
    "terms": {
      "title": [
        "definitive",
        "guide2"
      ],
      "minimum_match": 2
    }
  }
}

3、match、match_all、match_phrase 查询

match 查询可接收文字、日期、时间类型的数据
match 和 term 查询的区别是：match查询时，ES会给定合适的分析器，term查询则不会。

GET /library/books/_search
{
  "query": {
    "match": {
        "price": "18"
    }
  }
}

match_all 搜索指定索引下所有的文档

GET /library/books/_search
{
  "query": {
    "match_all": {}
  }
}

match_phrase 短语查询，slop 定义关键词之间隔多少未知单词

GET /library/books/_search
{
  "query": {
    "match_phrase": {
        "title": {
          "query": "the,guide",
          "slop":1
        }
    }
  }
}

4、multi_match 查询

multi_match 可同时查询多个字段，如下代码：查询 title 和 preview 两个字段中包含 elasticsearch字段的文档

GET /library/books/_search
{
  "query": {
    "multi_match": {
          "query": "preview",
          "fields":["title","preview"]
    }
  }
}

5、prefix 前置匹配查询

查询列数据为固定前缀的文档信息

GET /library/books/_search
{
  "query": {
    "prefix": {
        "title":{
          "value": "el"
        }
    }
  }
}

6、range 范围查询

有 from、to、include_lower、include_upper、boost这些参数，
include_lower：是否包含范围的左边界，默认为true
include_upper：是否包含范围的右边界，默认为true

GET /library/books/_search
{
  "query": {
    "range": {
        "price":{
          "from": 19.99,
          "to":30,
          "include_lower":false,
          "include_lower":false
        }
    }
  }
}

7、wildcard 查询

允许使用通配符* 和？进行查询
*：一个或者多个字符
？：仅代表一个字符
wildcard 查询很耗性能

GET /library/books/_search
{
  "query": {
    "wildcard": {
        "title":"el?s*"
    }
  }
}

8、fuzzy 模糊查询

fuzzy查询
value：查询的关键字
boost：设置查询的权值，默认为1.0
min_similarity：设置匹配的最小相似度，默认值为0.5，对于字符串值为0-1，对于数值取值可能大于1，对于日期型，取值为1d、2d、1m 分别代表一天两天一月。
prefix_length：指明区分词项的共同前缀长度，默认值为0
max_expansions：指明查询中的词项可扩展的数目。
此查询比较耗性能。

GET /library/books/_search
{
  "query":{
    "fuzzy": {
      "title":{
        "value": "guideb",
        "min_similarity": 0.5
      }
    }
  }
}

更多查询还有：
fuzzy_like_this 查询
fuzzy_like_this_field查询，功能与fuzzy_like_this一致，但fuzzy_like_this_field只可作用于一个字段。
more_like_this 查询
more_like_this_field 查询，类似于fuzzy_like_this_field。

10、查询的其他配置

1、指定查询返回的列

fields 代表返回的结果字段，不指明代表返回全部

GET /library/books/_search
{
  "fields": ["title"],
  "query": {
    "term": {
        "title": "definitive"
    }
  }
}

2、partial_fields 指定和排除字段

partial_fields,可以指定和排除返回的字段，如下：

GET /library/books/_search
{
  "partial_fields": {
    "partial": {
      "include": ["title"],
      "exclude": ["preview"]
    }
  }, 
  "query": {
    "term": {
        "title": "definitive"
    }
  }
}

可以配合通配符使用：

GET /library/books/_search
{
  "partial_fields": {
    "partial": {
      "include": ["ti*"],
      "exclude": ["pr*"]
    }
  }, 
  "query": {
    "term": {
        "title": "definitive"
    }
  }
}

3、sort 对结果进行排序

sort ：asc 升序，desc

GET /library/books/_search
{
  "query": {
    "term": {
        "title": "definitive"
    }
  },
  "sort":{
    "price":{
      "order":"desc"
    }
  }
}

4、指定返回结果数量

from 代表返回结果的开始下标，size 代表返回的结果数量

GET /library/books/_search
{
  "from": 1,
  "size": 20,
  "query": {
    "term": {
        "title": "definitive"
    }
  }
}

11、filter 过滤查询

filter 查询可以实现基本查询的功能，语法类似与 Sql 语法，而且自带 cache缓存，提升二次查询速度，推荐使用 filter查询。

建立测试数据，建立store索引，products类型，新增四条文档：

PUT http://localhost:9200/store/
{
    "setting":{
        "index":{
            "number_of_shards":5,
            "number_of_replicas":1
        }
    }
}
POST /store/products/_bulk
{"index":{"_id":1}}
{"price":10,"productID":"SD100"}
{"index":{"_id":2}}
{"price":20,"productID":"SD200"}
{"index":{"_id":3}}
{"price":30,"productID":"SD300"}
{"index":{"_id":4}}
{"price":40,"productID":"SD400"}

1、简单filter查询

模拟SQL：select * from products where price=20
filered 查询商品价格是20的商品

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "query": {
        "match_all": {}
      },
      "filter": {
        "term": {
          "price": 20
        }
      }
    }
  }
}

此处查询内容可以指定多个值：

"price": [10,20]

2、bool 过滤查询

可以进行组合查询，类似于 SQL中的 and 、or、not，格式如下：
{
"bool":{
"must":{},
"shoulld":{},
"must_not":{}
}
}
must：里面的条件必须满足，类似于 and
should：里面的条件至少满足一个，类似于 or
must_not：里面的条件必须不能满足，类似于 not

代码示例：
模拟SQL:select * from products where (price=20 or productID="SD100") and price != 30

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "filter": {
        "bool": {
          "should":[
            {"term": {"price": 20}},
            {"term": {"productID": "sd100"}}
          ],
          "must_not": [
            {"term": {"price": 30}}
          ]
        }
      }
    }
  }
}

3、嵌套查询

模拟SQL：select * from products where productID='sd100' or (productID='SD200' and price=20)

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "filter": {
        "bool": {
          "should":[
            {"term": {"productID": "sd100"}},
            {"bool": {
              "must": [
                {"term": {"productID": "sd200"}},
                {"term": {"price":20}}
              ]
            }}
          ]
        }
      }
    }
  }
}

4、另一种 and、or、not 查询

没有bool，直接使用 and、or、not
此种查询，不带缓存

模拟SQL：
select * from products where productID='sd100' or (productID='SD200' and price=20)

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "filter": {
          "or":[
            {"term": {"productID": "sd100"}},
            {"and": [
                {"term": {"productID": "sd200"}},
                {"term": {"price":20}}
              ]
            }
          ]
      }
    }
  }
}

136 0969 7310

5、range 范围查询

模拟SQL:SLECT * FROM products where price BETWEEN 20 AND 40
gt：> 大于
lt：< 小于
gte： >= 大于等于
lte： <= 小于等于

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "filter": {
          "range":
            {"price": 
              {"gt":20,"lt":40}}
      }
    }
  }
}

6、过滤空非空

使用关键词：missing、exists
初始化数据：
POST /store/products/_bulk
{"index":{"_id":5}}
{"price":50,"productID":null}

模拟SQL：SELECT * FROM products where productID is null

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "filter": {
          "missing": {
            "field": "productID"
          }
      }
    }
  }
}

模拟SQL：SELECT * FROM products where productID is not null

GET  /store/products/_search
{
  "query": {
    "filtered": {
      "filter": {
          "exists": {
            "field": "productID"
          }
      }
    }
  }
}

12、组合查询

1、bool查询

类似于SQL 中的 where
1、must、should、must_not
2、minmum_should_match：表示一个文档中至少匹配多少个关键词才算匹配成功，一般作用于should。
3、disable_coord：启用和禁用一个文档中所包含所有关键词的分数得分计算，默认值是 false。

2、boosting 查询

将两个查询封装在一起，降低一个查询结果返回的分值

positive部分：查询的查询结果分值不变
negative部分：查询的结果分值会被降低
negative_boost部分：设置negative中要降低的分数。

3、constant_score查询

可以让一个查询得到一个恒定的分值。

4、indices 查询

可以查询其他索引里面的数据。

ElasticSearch_1.7.1

1、ES安装

2、Head插件安装

3、BigDesk插件安装

4、Marvel插件的安装

5、索引的CRUD操作

1、索引的增加

2、索引的查询

6、对文档的操作

1、创建一条文档记录

2、查询一条文档记录

3、通过 _source 获取指定字段

4、对文档进行更新操作

5、删除一个文档

7、批量获取多个文档

1、获取不同Index的信息

2、获取相同Index下，相同Type下,不同ID的文档

8、对文档内容的批量操作

9、搜索查询入门

1、简单查询

2、Term查询和Terms查询

3、match、match_all、match_phrase 查询

4、multi_match 查询

5、prefix 前置匹配查询

6、range 范围查询

7、wildcard 查询

8、fuzzy 模糊查询

10、查询的其他配置

1、指定查询返回的列

2、partial_fields 指定和排除字段

3、sort 对结果进行排序

4、指定返回结果数量

11、filter 过滤查询

1、简单filter查询

2、bool 过滤查询

3、嵌套查询

4、 另一种 and、or、not 查询

5、range 范围查询

6、过滤空非空

12、组合查询

1、bool查询

2、boosting 查询

3、constant_score查询

4、indices 查询

内容目录

选择主题

4、另一种 and、or、not 查询