1.索引库操作
索引库就类似数据库表,mapping映射就类似表的结构。
我们要向es中存储数据,必须先创建“库”和“表”。
1.1.mapping映射属性
mapping是对索引库中文档的约束,常见的mapping属性包括:
type:字段数据类型,常见的简单类型有:
- 字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip地址)
- 数值:long、integer、short、byte、double、float、
- 布尔:boolean
- 日期:date
- 对象:object
- index:是否创建索引,默认为true
- analyzer:使用哪种分词器
- properties:该字段的子字段
例如下面的json文档:
{
"age": 21,
"weight": 52.1,
"isMarried": false,
"info": "elk基础入门",
"email": "sikns@qq.com",
"score": [99.1, 99.5, 98.9],
"name": {
"firstName": "云",
"lastName": "赵"
}
}
对应的每个字段映射(mapping):
- age:类型为 integer;参与搜索,因此需要index为true;无需分词器
- weight:类型为float;参与搜索,因此需要index为true;无需分词器
- isMarried:类型为boolean;参与搜索,因此需要index为true;无需分词器
- info:类型为字符串,需要分词,因此是text;参与搜索,因此需要index为true;分词器可以用ik_smart
- email:类型为字符串,但是不需要分词,因此是keyword;不参与搜索,因此需要index为false;无需分词器
- score:虽然是数组,但是我们只看元素的类型,类型为float;参与搜索,因此需要index为true;无需分词器
name:类型为object,需要定义多个子属性
- name.firstName;类型为字符串,但是不需要分词,因此是keyword;参与搜索,因此需要index为true;无需分词器
- name.lastName;类型为字符串,但是不需要分词,因此是keyword;参与搜索,因此需要index为true;无需分词器
1.2.添加索引库
PUT /myproject
{
"mappings": {
"properties": {
"info": {
"type": "text",
"analyzer": "ik_smart"
},
"email": {
"type": "keyword",
"index": false
},
"name": {
"type": "object",
"properties": {
"firstName":{
"type":"keyword"
},
"lastName":{
"type":"keyword"
}
}
}
}
}
}
1.3 查看索引库
GET /索引库名
GET /myproject
1.4 删除索引库
DELETE /索引库名
DELETE /myproject
1.5 修改操作
索引库和mapping一旦创建无法修改,但是可以添加新的字段
PUT /索引库名/_mapping
{
"properties":{
"新字段名":{
"type":"integer"
}
}
}
PUT /myproject/_mapping
{
"properties":{
"age":{
"type":"integer"
}
}
}
1.6.插入文档
POST /myproject/_doc/1
{
"info":"第一个文档信息",
"email":"812257301@qq.com",
"name":{
"firstName":"云",
"lastName":"赵"
}
}
1.7.查询文档
GET /myproject/_doc/1
1.8.删除文档
DELETE /myproject/_doc/1
1.9.修改文档
1.9.1 全量修改(全量修改,会删除旧文档,添加新文档)
PUT /myproject/_doc/1
{
"info":"修改后的文档信息",
"email":"8122527301@qq.com",
"name":{
"firstName":"赵",
"lastName":"云"
}
}
1.9.2 局部修改(局部修改文档字段)
POST /myproject/_update/1
{
"doc":{
"info":"局部更新info"
}
}
2.0.0 copy_to整合多个字段提高查询效率,查询就可以通过all查询所有将其加入到all的字段。
PUT /hotel
{
"mappings": {
"properties": {
"id":{
"type": "keyword"
},
"name":{
"type": "text",
"analyzer": "ik_max_word",
"copy_to": "all"
},
"address":{
"type": "keyword",
"index":false
},
"price":{
"type": "integer"
},
"score":{
"type": "integer"
},
"brand":{
"type": "keyword",
"copy_to": "all"
},
"city":{
"type":"keyword"
},
"starName":{
"type": "keyword"
},
"business":{
"type":"keyword",
"copy_to": "all"
},
"lcoation":{
"type": "geo_point"
},
"pic":{
"type":"keyword",
"index": false
},
"all":{
"type":"text",
"analyzer": "ik_max_word"
}
}
}
}
#根据all字段查询
GET /myproject/_search
{
"query": {
"match": {
"all": "局部"
}
}
}
2.1精准查询
精确查询一般是查找keyword、数值、日期、boolean等类型字段。所以不会对搜索条件分词。常见的有:
- term:根据词条精确值查询
- range:根据值的范围查询
2.1.1 term查询
因为精确查询的字段搜是不分词的字段,因此查询的条件也必须是不分词的词条。查询时,用户输入的内容跟自动值完全匹配时才认为符合条件。如果用户输入的内容过多,反而搜索不到数据。
语法说明:
// term查询
GET /indexName/_search
{
"query": {
"term": {
"FIELD": {
"value": "VALUE"
}
}
}
}
示例:
当我搜索的是精确词条时,能正确查询出结果:
但是,当我搜索的内容不是词条,而是多个词语形成的短语时,反而搜索不到:
2.2范围查询
范围查询,一般应用在对数值类型做范围过滤的时候。比如做价格范围过滤。
基本语法:
// range查询
GET /indexName/_search
{
"query": {
"range": {
"FIELD": {
"gte": 10, // 这里的gte代表大于等于,gt则代表大于
"lte": 20 // lte代表小于等于,lt则代表小于
}
}
}
}
示例:
elasticsearch doc 数据
tb_hotel.sqlhttps://cdn.oolo.cc/source/tb_hotel.sql
总结:精确查询常见的有哪些?
- term查询:根据词条精确匹配,一般搜索keyword类型、数值类型、布尔类型、日期类型字段
- range查询:根据数值范围查询,可以是数值、日期的范围