- Hive 简单说明
- 他没有很多的架构来讲,他就是一个简单的工具
- 数据仓库软件,分布式的读,i写管理大数据
- 访问方式 :JDBC(代码),命令行工具(常用)
- FaceBook 数据太大,需要大数据工程师,办法:用sql,sql转化为mapreduce程序,自动提交个yarn。
- 关系型数据库和hive对比
- 数据库
- RDBMS
- SQL
- 数据库适合OLTP及在线事务处理(淘宝点,商品详情显示,在数据库中找,)速度快,延迟低。
- HIve
- OLAP 在先分析处理,(我们可以进行等待)数据慢,延迟高,中在于海量数据的处理
- HIve 官网: hive.apache.org
- hive 的本质:MapReduce.对于我们来说时写sql,但是其实就是通过hive转化为mapreduce..他尽可以管理hdfs中的数据
- 数据库和数据仓库应用场景
- hive的实现机制
- Hive 环境的准备