通过hadoop上的hive完成WordCount
1.启动hadoop
2.Hdfs上创建文件夹
先创建user 之后创建hadoop ,之后创建wcinput,之后查看目录
3.上传文件至hdfs
首先创建并编辑要上传的文件,我的是159.txt.
4.启动Hive
5.创建原始文档表
6.导入文件内容到表docs并查看
7.用HQL进行词频统计,结果放在表word_count里
我创建的是words_count
8.查看统计结果
使用split函数对表中按空格进行分隔: