编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

Elasticserch如何使用term进行精确查询

wxchong 2024-08-18 00:55:47 开源技术 11 ℃ 0 评论

作者:dabai567
链接:https://gobea.cn/blog/detail/g5pOjgra.html
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

~~~~

为了配合本文的讲解,我们先导入一批数据

curl -H 'Content-type: application/x-ndjson' -XPOST 'http://127.0.0.1:9200/my_store/_doc/_bulk' -d '{"index":{"_id":1}}
{"price":10,"productID":"XHDK-A-1293-#fJ3"}
{"index":{"_id":2}}
{"price":20,"productID":"KDKE-B-9947-#kL5"}
{"index":{"_id":3}}
{"price":30,"productID":"JODL-X-1937-#pV7"}
{"index":{"_id":4}}
{"price":30,"productID":"QQPX-R-3956-#aD8"}
'

match和term有什么区别

使用match搜索文本时,es会先将文本进行分词,然后将分词后多个关键字再去搜索,而term则不会先去分词,直接将文本原封不动的去搜索,如下:

{
    "query": {
        "match": { //1
            "productID": "JODL-X-1937-#pV7"
        }
    }
}
{
    "query": {
        "term": { //2
            "productID": "JODL-X-1937-#pV7"
        }
    }
}
  • //1 match查询会将JODL-X-1937-#pV7拆分成jodlx1937#pv7多个关键词之后再去搜索
  • //2 term查询会将JODL-X-1937-#pV7作为一个词直接去搜索

为什么用term得不到结果

term查询会精确搜索JODL-X-1937-#pV7,但是当我们执行查询语句时,并没有得到期望的结果(搜索不到结果),原因是我们在导入的数据时productID是先被分词之后再保存在es的,我们可以通过es提供的api接口_analyze来查看es实际存储productID的文本,执行如下命令:

curl -X GET "127.0.0.1:9200/my_store/_analyze?pretty" -H 'Content-Type: application/json' -d'
{
  "field": "productID",
  "text": "XHDK-A-1293-#fJ3"
}
'


如图所示,XHDK-A-1293-#fJ3在导入数据的时候被拆分成了多个关键字,如果用XHDK-A-1293-#fJ3来进行匹配,肯定无法匹配到数据。那么我们要怎么才能在导入的时候不让文本分词,方案是我们可以将productID设置为keyword类型,现在我们需要重新创建映射mapping,步骤如下:

#删除索引,删除索引是必须的,因为我们不能更新已存在的映射
curl -H 'Content-type: application/json' -XDELETE 'http://127.0.0.1:9200/my_store'

#重新创建mapping
curl -H 'Content-type: application/json' -XPUT 'http://127.0.0.1:9200/my_store' -d '{
 "mappings": {
  "_doc": {
   "properties": {
    "productID": {
     "type": "keyword", //设置`productID`为`keyword`类型
     "ignore_above": 64
    }
   }
  }
 }
}'

#再次重新导入数据
curl -H 'Content-type: application/x-ndjson' -XPOST 'http://127.0.0.1:9200/my_store/_doc/_bulk' -d '{"index":{"_id":1}}
{"price":10,"productID":"XHDK-A-1293-#fJ3"}
{"index":{"_id":2}}
{"price":20,"productID":"KDKE-B-9947-#kL5"}
{"index":{"_id":3}}
{"price":30,"productID":"JODL-X-1937-#pV7"}
{"index":{"_id":4}}
{"price":30,"productID":"QQPX-R-3956-#aD8"}
'

执行上面步骤之后,我们再通过API接口_analyze查看


现在productID已经不会被分词了,最后,我们再执行下term查询,已经可以找到数据了,如下图所示

总结

  • term是精确搜索
  • 在搜索文本情况下,term一般配合keyword类型进行搜索

参考

  • https://www.elastic.co/guide/cn/elasticsearch/guide/current/_finding_exact_values.html

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表