ElasticSearch 学习

2021-08-18 19:43:42 +08:00
 MaoRong

es 大致结构

{
    "track_total_hits": true, //获取 query 里面查询到的总条数
    "query":{},//查询语句筛选条件
    "aggs":{},//管道
    "sort":[],//排序
    "_source":[],//字段筛选
    "size":0,//查询的大小
    "from":0//从哪里查
}

关于 query

match_phrase 与 match

match_phrased 必须要包含查询的词组,math 可以包含查询的词组也可以将词组拆分查询

来源:https://blog.csdn.net/liuxiao723846/article/details/78365078

terms 与 term

term (精确值查找)

term 查询, 可以用它处理数字( numbers )、布尔值( Booleans )、日期( dates )以及文本( text )

trems (查找多个精确值)

terms 是 包含( contains ) 操作,而非 等值( equals )

其中 country_number_id 需要使用.keyword

{
  "terms": {
    "country_number_id.keyword": [
      "CN",
      "HK",
      "IN",
      "JP",
      "KR",
      "MO"
    ]
  }
}

重点 aggs

返回数据 是从 aggregations 中获取

示例:

"aggs": {
    "country_number_id": {
      "terms": {
        "field": "country_number_id.keyword",
        "size": 10000 //这里指的是需要返回 country_number_id 的桶的个数,但不代表是查询的数据量
      },
      "aggs": {
        "category_number_id": {
          "terms": {
            "field": "category_number_id.keyword",
            "size": 10000,//同上,不过是 category_number_id
            "order": {
              "revenue": "desc"//这个字段用的是下面 sum 聚合的 revenue
            }
          },
          "aggs": {
            "revenue": {
              "sum": {//sum,avg,min,max
                "field": "revenue"
              }
            },
            "downloads": {
              "sum": {
                "field": "downloads"
              }
            },
            "top": {//随便取名
              "top_hits": {//关键字
                "size": 1,//category_number_id 下面桶里数据的条数
                "_source": [//里面命中数据字段筛选
                  "os",
                  "revenue",
                  "country_number_id",
                  "category_number_id",
                  "category_name",
                  "country_name",
                  "downloads"
                ]
              }
            }
          }
        }
      }
    }

关于 aggs 的疑惑

  1. 多个字段聚合的时候怎么做排序,比如这边用 country_number_id 和 category_number_id 聚合,使用 sum 来的 revenue 做一个排序,但是实际是 country_number_id 大桶里面包含小桶,小桶里面可以根据 revenue 排序,无法做一整个排序
  2. 多个字段聚合的时候将两个字段嵌套顺序替换,查出来的数据量变了,其他筛选条件什么都没变
2132 次点击
所在节点    Elasticsearch
3 条回复
BJL
2021-08-19 11:26:09 +08:00
1.后续代码处理
2.如果你说的是上面的 country 和 category,可能的原因有一个,terms 聚合在下面这种情况会有误差
This means that if the number of unique terms is greater than size, the returned list is slightly off and not accurate (it could be that the term counts are slightly off and it could even be that a term that should have been in the top size buckets was not returned).
BJL
2021-08-19 11:54:44 +08:00
当然,1 这个排序问题也可以在 country 下一级,category 平级再加一个对 revenue 的 sum agg,让 coutry 的 order 按这个新加的来
MaoRong
2021-08-19 14:09:20 +08:00
@BJL 多谢,我去试试

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/796618

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX