elasticsearch 聚合查询DSL-08

博主： Sikn
发布时间：2021 年 12 月 02 日
623 次浏览
2 条评论
2894字数
分类：学习

聚合查询

DSL实现聚合

现在，我们要统计所有数据中的酒店品牌有几种，其实就是按照品牌对数据分组。此时可以根据酒店品牌的名称做聚合，也就是Bucket聚合。
语法如下：

GET /hotel/_search
{
  "size": 0,  // 设置size为0，结果中不包含文档，只包含聚合结果
  "aggs": { // 定义聚合
    "brandAgg": { //给聚合起个名字
      "terms": { // 聚合的类型，按照品牌值聚合，所以选择term
        "field": "brand", // 参与聚合的字段
        "size": 20 // 希望获取的聚合结果数量
      }
    }
  }
}

结果如图：

聚合结果排序

默认情况下，Bucket聚合会统计Bucket内的文档数量，记为_count，并且按照_count降序排序。

我们可以指定order属性，自定义聚合的排序方式：

GET /hotel/_search
{
  "size": 0
  , "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand",
        "order": {
          "_count": "desc"
        },
        "size": 10
      }
    }
  }
}

查询结果：

限定聚合范围

默认情况下，Bucket聚合是对索引库的所有文档做聚合，但真实场景下，用户会输入搜索条件，因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。

我们可以限定要聚合的文档范围，只要添加query条件即可：

GET /hotel/_search
{
  "query": {
    "range": {
      "price": {
        "lte": 200
      }
    }
  },
  "size": 0,
  "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand",
        "size": 20
      }
    }
  }
}

查询结果：查询出的数据明显少了很多

Metric聚合语法

之前我们对酒店按照品牌分组，形成了一个个桶。现在我们需要对桶内的酒店做运算，获取每个品牌的用户评分的min、max、avg等值。

这就要用到Metric聚合了，例如stat聚合：就可以获取min、max、avg等结果。
语法如下：

聚合查询

DSL实现聚合

现在，我们要统计所有数据中的酒店品牌有几种，其实就是按照品牌对数据分组。此时可以根据酒店品牌的名称做聚合，也就是Bucket聚合。
语法如下：

GET /hotel/_search
{
  "size": 0,  // 设置size为0，结果中不包含文档，只包含聚合结果
  "aggs": { // 定义聚合
    "brandAgg": { //给聚合起个名字
      "terms": { // 聚合的类型，按照品牌值聚合，所以选择term
        "field": "brand", // 参与聚合的字段
        "size": 20 // 希望获取的聚合结果数量
      }
    }
  }
}

结果如图：

聚合结果排序

默认情况下，Bucket聚合会统计Bucket内的文档数量，记为_count，并且按照_count降序排序。

我们可以指定order属性，自定义聚合的排序方式：

GET /hotel/_search
{
  "size": 0
  , "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand",
        "order": {
          "_count": "desc"
        },
        "size": 10
      }
    }
  }
}

查询结果：

限定聚合范围

默认情况下，Bucket聚合是对索引库的所有文档做聚合，但真实场景下，用户会输入搜索条件，因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。

我们可以限定要聚合的文档范围，只要添加query条件即可：

GET /hotel/_search
{
  "query": {
    "range": {
      "price": {
        "lte": 200
      }
    }
  },
  "size": 0,
  "aggs": {
    "brandAgg": {
      "terms": {
        "field": "brand",
        "size": 20
      }
    }
  }
}

查询结果：查询出的数据明显少了很多

Metric聚合语法

之前我们对酒店按照品牌分组，形成了一个个桶。现在我们需要对桶内的酒店做运算，获取每个品牌的用户评分的min、max、avg等值。

这就要用到Metric聚合了，例如stat聚合：就可以获取min、max、avg等结果。
语法如下：

最后修改：2022 年 01 月 30 日

© 允许规范转载

如果觉得我的文章对你有用，请随意赞赏

2 条评论

白鸽
2021-12-27 14:01:32

这个很帮|´・ω・)ノ

回复
1. Sikn
  2021-12-27 14:23:53
  
  @白鸽
  
  回复

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

菜狗
大佬好强！！！orz orz orz
知名的打工人
1.配置了 sasl 过后，如果启动出现问题，可能是在 kaf...
包谷
重启 kafka 服务至此、broker之间连接认证就已经完成...
kaic
大佬，有完整的项目代码么，我发现粘贴的代码有一些缺少了，进行不...
菜狗
大佬太强了！orz！

elasticsearch 聚合查询DSL-08

Sikn • 2021 年 12 月 02 日

<h1>聚合查询</h1><h2>DSL实现聚合</h2><p>现在，我们要统计所有数据中的酒店品牌有几种，其实就是按照品牌对数据分组。此时可以根据酒店品牌的名称做聚合，也就是Bucket聚合。<br>语法如下：</p><pre><code class="lang-JSON">GET /hotel/_search
{
  &quot;size&quot;: 0,  // 设置size为0，结果中不包含文档，只包含聚合结果
  &quot;aggs&quot;: { // 定义聚合
    &quot;brandAgg&quot;: { //给聚合起个名字
      &quot;terms&quot;: { // 聚合的类型，按照品牌值聚合，所以选择term
        &quot;field&quot;: &quot;brand&quot;, // 参与聚合的字段
        &quot;size&quot;: 20 // 希望获取的聚合结果数量
      }
    }
  }
}</code></pre><p>结果如图：<br><img src="https://oolo.cc/usr/themes/handsome/assets/img/loading.svg" alt="" title=""style=""data-original="https://cdn.oolo.cc/source/20211202170858.png"></p><h2>聚合结果排序</h2><p>默认情况下，Bucket聚合会统计Bucket内的文档数量，记为_count，并且按照_count降序排序。</p><p>我们可以指定order属性，自定义聚合的排序方式：</p><pre><code class="lang-JSON">GET /hotel/_search
{
  &quot;size&quot;: 0
  , &quot;aggs&quot;: {
    &quot;brandAgg&quot;: {
      &quot;terms&quot;: {
        &quot;field&quot;: &quot;brand&quot;,
        &quot;order&quot;: {
          &quot;_count&quot;: &quot;desc&quot;
        },
        &quot;size&quot;: 10
      }
    }
  }
}</code></pre><p>查询结果：<br><img src="https://oolo.cc/usr/themes/handsome/assets/img/loading.svg" alt="" title=""style=""data-original="https://cdn.oolo.cc/source/20211202171001.png"></p><h2>限定聚合范围</h2><p>默认情况下，Bucket聚合是对索引库的所有文档做聚合，但真实场景下，用户会输入搜索条件，因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。</p><p>我们可以限定要聚合的文档范围，只要添加query条件即可：</p><pre><code class="lang-JSON">GET /hotel/_search
{
  &quot;query&quot;: {
    &quot;range&quot;: {
      &quot;price&quot;: {
        &quot;lte&quot;: 200
      }
    }
  },
  &quot;size&quot;: 0,
  &quot;aggs&quot;: {
    &quot;brandAgg&quot;: {
      &quot;terms&quot;: {
        &quot;field&quot;: &quot;brand&quot;,
        &quot;size&quot;: 20
      }
    }
  }
}</code></pre><p>查询结果：查询出的数据明显少了很多<br><img src="https://oolo.cc/usr/themes/handsome/assets/img/loading.svg" alt="" title=""style=""data-original="https://cdn.oolo.cc/source/20211202171204.png"></p><h2>Metric聚合语法</h2><p>之前我们对酒店按照品牌分组，形成了一个个桶。现在我们需要对桶内的酒店做运算，获取每个品牌的用户评分的min、max、avg等值。</p><p>这就要用到Metric聚合了，例如stat聚合：就可以获取min、max、avg等结果。<br>语法如下：</p><h1>聚合查询</h1><h2>DSL实现聚合</h2><p>现在，我们要统计所有数据中的酒店品牌有几种，其实就是按照品牌对数据分组。此时可以根据酒店品牌的名称做聚合，也就是Bucket聚合。<br>语法如下：</p><pre><code class="lang-JSON">GET /hotel/_search
{
  &quot;size&quot;: 0,  // 设置size为0，结果中不包含文档，只包含聚合结果
  &quot;aggs&quot;: { // 定义聚合
    &quot;brandAgg&quot;: { //给聚合起个名字
      &quot;terms&quot;: { // 聚合的类型，按照品牌值聚合，所以选择term
        &quot;field&quot;: &quot;brand&quot;, // 参与聚合的字段
        &quot;size&quot;: 20 // 希望获取的聚合结果数量
      }
    }
  }
}</code></pre><p>结果如图：<br><img src="https://oolo.cc/usr/themes/handsome/assets/img/loading.svg" alt="" title=""style=""data-original="https://cdn.oolo.cc/source/20211202170858.png"></p><h2>聚合结果排序</h2><p>默认情况下，Bucket聚合会统计Bucket内的文档数量，记为_count，并且按照_count降序排序。</p><p>我们可以指定order属性，自定义聚合的排序方式：</p><pre><code class="lang-JSON">GET /hotel/_search
{
  &quot;size&quot;: 0
  , &quot;aggs&quot;: {
    &quot;brandAgg&quot;: {
      &quot;terms&quot;: {
        &quot;field&quot;: &quot;brand&quot;,
        &quot;order&quot;: {
          &quot;_count&quot;: &quot;desc&quot;
        },
        &quot;size&quot;: 10
      }
    }
  }
}</code></pre><p>查询结果：<br><img src="https://oolo.cc/usr/themes/handsome/assets/img/loading.svg" alt="" title=""style=""data-original="https://cdn.oolo.cc/source/20211202171001.png"></p><h2>限定聚合范围</h2><p>默认情况下，Bucket聚合是对索引库的所有文档做聚合，但真实场景下，用户会输入搜索条件，因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。</p><p>我们可以限定要聚合的文档范围，只要添加query条件即可：</p><pre><code class="lang-JSON">GET /hotel/_search
{
  &quot;query&quot;: {
    &quot;range&quot;: {
      &quot;price&quot;: {
        &quot;lte&quot;: 200
      }
    }
  },
  &quot;size&quot;: 0,
  &quot;aggs&quot;: {
    &quot;brandAgg&quot;: {
      &quot;terms&quot;: {
        &quot;field&quot;: &quot;brand&quot;,
        &quot;size&quot;: 20
      }
    }
  }
}</code></pre><p>查询结果：查询出的数据明显少了很多<br><img src="https://oolo.cc/usr/themes/handsome/assets/img/loading.svg" alt="" title=""style=""data-original="https://cdn.oolo.cc/source/20211202171204.png"></p><h2>Metric聚合语法</h2><p>之前我们对酒店按照品牌分组，形成了一个个桶。现在我们需要对桶内的酒店做运算，获取每个品牌的用户评分的min、max、avg等值。</p><p>这就要用到Metric聚合了，例如stat聚合：就可以获取min、max、avg等结果。<br>语法如下：</p>