问题
人口普查越来越难,不得不使用随机采样分析。
特点
- 大数据是不用随即分析法而采用所有数据的方法。
- 大数据并不一定是精确的,我们需要容忍他的不精确和不完美,因为数据是杂乱的。
- 相关关系而不是因果关系
栗子
-
麻省理工与通货紧缩预测软件
需求: 获取消费物价指数,测试通货膨胀率。
用户: 投资者,商家,美联储,联邦政府。
问题: 采集数据需要花费两亿五千万美元,并且有几周的延迟。
解决方案:通过软件在互联网收集信息,每天都可以收集到数据,虽然混乱且不是所有数据都可以进行比较,但结合好的分析法,可以更快获得通货膨胀率。 -
沃尔玛,请把蛋挞和飓风用品摆在一起
每当季节性飓风来临之前,不仅手电筒销售量增加了,蛋挞销量也增加了。 -
UPS与汽车修理预测
以前UPS每两三年都要对汽车的零件进行定时更换。
通过检测汽车的各个部位,UPS如今只需要更换需要更换的零件。从而节省了好几百万美元。
同理,也可以用来监测桥梁,建筑物,病人。