1. 数据准备(tab分割不要用空格)
悟空 A 男
大海 A 男
宋宋 B 男
凤姐 A 女
婷姐 B 女
婷婷 B 女
2.需求
求出不同部门男女各多少人。结果如下:
3.新建文件将上述内容写入
vi emp_sex.txt
4.在hive创建数据表
create table emp_sex( name string, dept_id string, sex string) row format delimited fields terminated by " ";//每行的每一列分割 load data local inpath '/home/hadoop/file/emp_sex' into table emp_sex;//将文件的数据导入到数据库中
5.按需求查询
select > > dept_id, > > sum(case sex when '男' then 1 else 0 end) male_count,//如果时男那么male_count+1 > > sum(case sex when '女' then 1 else 0 end) female_count//如果时女那么female_count+1 > > from > > emp_sex > > group by > > dept_id;//按照部门分组
6.结果显示