9.3 9.4 9.5 9.6 10 11 12 13 14 15
阿里云PostgreSQL 问题报告 纠错本页面

2.7. 聚集函数

和大多数其它关系数据库产品一样,PostgreSQL支持聚集函数。 一个聚集函数从多个输入行中计算出一个结果。 比如,我们有在一个行集合上计算count(计数)、sum(和)、avg(均值)、max(最大值)和min(最小值)的函数。

比如,我们可以用下面的语句找出所有记录中最低温度中的最高温度:

SELECT max(temp_lo) FROM weather;

 max
-----
  46
(1 row)

如果我们想知道该读数发生在哪个城市,我们可以用:

SELECT city FROM weather WHERE temp_lo = max(temp_lo);     错误

不过这个方法不能运转,因为聚集max不能被用于WHERE子句中(存在这个限制是因为WHERE子句决定哪些行可以被聚集计算包括;因此显然它必需在聚集函数之前被计算)。 不过,我们通常都可以用其它方法实现我们的目的;这里我们就可以使用子查询

SELECT city FROM weather
    WHERE temp_lo = (SELECT max(temp_lo) FROM weather);

     city
---------------
 San Francisco
(1 row)

这样做是 OK 的,因为子查询是一次独立的计算,它独立于外层的查询计算出自己的聚集。

聚合函数在与GROUP BY子句结合时也非常有用。例如,我们可以通过以下查询获取每个城市的读数和观察到的最低温度:

SELECT city, count(*), max(temp_lo)
    FROM weather
    GROUP BY city;

     city      | count | max
---------------+-------+-----
 Hayward       |     1 |  37
 San Francisco |     2 |  46
(2 rows)

这使我们每个城市得到一个输出行。每个聚合结果是在匹配该城市的表行上计算的。 我们可以使用HAVING来过滤这些分组的行:

SELECT city, count(*), max(temp_lo)
    FROM weather
    GROUP BY city
    HAVING max(temp_lo) < 40;

  city   | count | max
---------+-------+-----
 Hayward |     1 |  37
(1 row)

这使我们仅获取所有temp_lo值低于40的城市的相同结果。最后,如果我们只关心以S开头的城市的话,我们可以这样做:

SELECT city, count(*), max(temp_lo)
    FROM weather
    WHERE city LIKE 'S%'            -- (1)
    GROUP BY city;

     city      | count | max
---------------+-------+-----
 San Francisco |     2 |  46
(1 row)

(1)

LIKE操作符进行模式匹配,详细说明请参见第 9.7 节

理解聚集和SQLWHERE以及HAVING子句之间的关系对我们非常重要。WHEREHAVING的基本区别如下:WHERE在分组和聚集计算之前选取输入行(因此,它控制哪些行进入聚集计算), 而HAVING在分组和聚集之后选取分组行。因此,WHERE子句不能包含聚集函数; 因为试图用聚集函数判断哪些行应输入给聚集运算是没有意义的。相反,HAVING子句总是包含聚集函数(严格说来,你可以写不使用聚集的HAVING子句, 但这样做很少有用。同样的条件用在WHERE阶段会更有效)。

在前面的例子里,我们可以在WHERE里应用城市名称限制,因为它不需要聚集。这样比放在HAVING里更加高效,因为可以避免那些未通过 WHERE检查的行参与到分组和聚集计算中。

选择进入聚合计算的行的另一种方法是使用FILTER,这是一个每个聚合的选项:

SELECT city, count(*) FILTER (WHERE temp_lo < 45), max(temp_lo)
    FROM weather
    GROUP BY city;

     city      | count | max
---------------+-------+-----
 Hayward       |     1 |  37
 San Francisco |     1 |  46
(2 rows)

FILTERWHERE非常相似, 不同之处在于它仅从附加到特定聚合函数的输入中删除行。 在这里,count聚合仅计算 temp_lo低于45的行;但是 max聚合仍然应用于所有行, 因此仍然找到46的读数。