最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
1,000 Bytes = 1 Kilobyte
1,000Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1Brontobyte
1,000 Brontobytes = 1 Geopbyte
======
大数据这个入门。
快速入门
看了一些资料,书籍,还是懵逼。
就是知道了一些大数据名词,但还是不清楚到底是怎么回事。
是什么,怎么用。云里雾里的,很容易浮躁,看不下去,难以入门。
一种难以沟通的感觉。
实践,需要Linux系统。自己没有。 需要有。
如果你想要走这条道路,那么就别撤退,不看了不学了不搞了。
既然想要搞,就想办法搞,遇到困难不必浮躁,冷静下来去解决。
========
High Scalability 高可扩展性
NoSQL是Not Only SQL的缩写
Sharding(分片)
分片是指将数据拆分,将其分散在不同机器上的过程。
分片就是数据拆分。 名字起得不好,都不知道啥意思。
什么是分布式?
分布式 什么意思
一个业务分拆多个子业务,部署在不同的服务器上。
集群:同一个业务,部署在多个服务器上
分布式 就是 拆分业务
集群 就是 多个机器共同分担一个业务。
HDFS—Hadoop Distributed File System
Hadoop分布式文件系统
Reduce 减少,分解。
MapReduce实现了Map和Reduce两个功能
Map把一个函数方法应用于集合中的所有成员,然后返回一个基于这个处理的结果集;
Reduce对结果集进行分类和归纳;
Map()和 Reduce() 两个函数可能会并行运行,
=======