作者:dabai567
链接:https://gobea.cn/blog/detail/g5pOjgra.html
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
~~~~
为了配合本文的讲解,我们先导入一批数据
curl -H 'Content-type: application/x-ndjson' -XPOST 'http://127.0.0.1:9200/my_store/_doc/_bulk' -d '{"index":{"_id":1}}
{"price":10,"productID":"XHDK-A-1293-#fJ3"}
{"index":{"_id":2}}
{"price":20,"productID":"KDKE-B-9947-#kL5"}
{"index":{"_id":3}}
{"price":30,"productID":"JODL-X-1937-#pV7"}
{"index":{"_id":4}}
{"price":30,"productID":"QQPX-R-3956-#aD8"}
'
match和term有什么区别
使用match搜索文本时,es会先将文本进行分词,然后将分词后多个关键字再去搜索,而term则不会先去分词,直接将文本原封不动的去搜索,如下:
{
"query": {
"match": { //1
"productID": "JODL-X-1937-#pV7"
}
}
}
{
"query": {
"term": { //2
"productID": "JODL-X-1937-#pV7"
}
}
}
- //1 match查询会将JODL-X-1937-#pV7拆分成jodl,x,1937,#pv7多个关键词之后再去搜索
- //2 term查询会将JODL-X-1937-#pV7作为一个词直接去搜索
为什么用term得不到结果
term查询会精确搜索JODL-X-1937-#pV7,但是当我们执行查询语句时,并没有得到期望的结果(搜索不到结果),原因是我们在导入的数据时productID是先被分词之后再保存在es的,我们可以通过es提供的api接口_analyze来查看es实际存储productID的文本,执行如下命令:
curl -X GET "127.0.0.1:9200/my_store/_analyze?pretty" -H 'Content-Type: application/json' -d'
{
"field": "productID",
"text": "XHDK-A-1293-#fJ3"
}
'
如图所示,XHDK-A-1293-#fJ3在导入数据的时候被拆分成了多个关键字,如果用XHDK-A-1293-#fJ3来进行匹配,肯定无法匹配到数据。那么我们要怎么才能在导入的时候不让文本分词,方案是我们可以将productID设置为keyword类型,现在我们需要重新创建映射mapping,步骤如下:
#删除索引,删除索引是必须的,因为我们不能更新已存在的映射
curl -H 'Content-type: application/json' -XDELETE 'http://127.0.0.1:9200/my_store'
#重新创建mapping
curl -H 'Content-type: application/json' -XPUT 'http://127.0.0.1:9200/my_store' -d '{
"mappings": {
"_doc": {
"properties": {
"productID": {
"type": "keyword", //设置`productID`为`keyword`类型
"ignore_above": 64
}
}
}
}
}'
#再次重新导入数据
curl -H 'Content-type: application/x-ndjson' -XPOST 'http://127.0.0.1:9200/my_store/_doc/_bulk' -d '{"index":{"_id":1}}
{"price":10,"productID":"XHDK-A-1293-#fJ3"}
{"index":{"_id":2}}
{"price":20,"productID":"KDKE-B-9947-#kL5"}
{"index":{"_id":3}}
{"price":30,"productID":"JODL-X-1937-#pV7"}
{"index":{"_id":4}}
{"price":30,"productID":"QQPX-R-3956-#aD8"}
'
执行上面步骤之后,我们再通过API接口_analyze查看
现在productID已经不会被分词了,最后,我们再执行下term查询,已经可以找到数据了,如下图所示
总结
- term是精确搜索
- 在搜索文本情况下,term一般配合keyword类型进行搜索
参考
- https://www.elastic.co/guide/cn/elasticsearch/guide/current/_finding_exact_values.html
本文暂时没有评论,来添加一个吧(●'◡'●)