1.实现的流程
需求分析
时间:日,时段
分区表:两级
PV
UV
数据清洗
2015-08-28 18:19:10
字段:id,url,guid,tracktime
数据分析
导出
2.新建源数据库

3.新建表

4.加载原始数据

5.查看部分结果

6.建立清洗数据表(方便下面的分区表的建立)


7.为清洗表加载数据

8.展示部分清洗过后的数据

9.建立分区表

10.加载数据

11.展示部分结果

二:动态分区表的建立
12.动态分区的配置修改
<property>
<name>hive.exec.dynamic.partition</name>
<value>true</value> ---》》默认是true,不需要再修改
<description>Whether or not to allow dynamic partitions in DML/DDL.</description>
</property>
<property>
<name>hive.exec.dynamic.partition.mode</name>
<value>nonstrict</value>
</property>

13.新建分区表

14.加载数据

15.查看部分结果

三:数据分析,实现需求
16.实现需求

17.把结果存入result中

17.导出数据进入mysql
1.新建表

2.整体输出结果

3.查看结果(mysql中)
