1. Group By语句
GROUP BY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。
1)计算emp表每个部门的平均工资
hive (default)> select t.deptno, avg(t.sal) avg_sal from emp t group by t.deptno;
2)计算emp每个部门中每个岗位的最高薪水
hive (default)> select t.deptno, t.job, max(t.sal) max_sal from emp t group by t.deptno, t.job;
2. Having语句
2.1. having与where不同点
1)where后面不能写分组函数,而having后面可以使用分组函数。
2)having只用于group by分组统计语句。
2.2. 案例实操
1)求每个部门的平均工资
hive (default)> select deptno, avg(sal) from emp group by deptno;
2)求每个部门的平均薪水大于2000的部门
hive (default)> select deptno, avg(sal) avg_sal from emp group by deptno having avg_sal > 2000;