作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639
1.分析所采用数据的来源有哪些?
- (1)交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
- (2)移动通讯数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。
- (3)人为数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。
- (4)互联网上的“开放数据”来源。如政府机构,非营利组织和企业免费提供的数据。
- (5)机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等。
2.大数据的呈现方式有哪些?
大数据主要采用可视化图标的呈现方式,可分为以下几种:
- 将指标值图形化。
-
将指标关系图形化
- 将时间和空间可视化
- 将指标图形化
3.大数据的特点是什么?对思维方式有何影响?
大数据具备以下4个特点:
- 一是数据量巨大。例如,人类生产的所有印刷材料的数据量仅为200PB。典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
- 二是数据类型多样。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。
- 三是处理速度快。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。
- 四是价值密度低。以视频为例,一小时的视频,在不间断的测试过程中,可能有用的数据仅仅只有一两秒。
对思维方式的影响:
首先,大数据的发展,改善了人们思维的局限性。在过去,数据流通速度慢,人们获取的数据资源有限,所以在看待事物方面,基于过去固有的眼界所限,人们看待事物会非常片面。比如当某个村庄,在没有结束新的事物前,当地所有人可能会认为某种陋习存在是必然的,无论加害者还是受害者。接收到的全是同一个地方的信息事物,使得人们对信息判断没有更多的参照物。当大数据的发展,人们接收到的信息不再局限于一个地区,一个国家,而是基于整个世界。自然而然的开阔了人的眼界,打破了人的固有思维。
另外,人们在认识事物时。对事物认识的精度也上升了。在现在对数据的处理,可以让我们详细的了解一个事物的详细数据,人们追求绝对的精准。由于数据处理速度的提升以及大量数据所提高的结果的真实性,改善了人们对以往处理问题时候的发生的片面看法,对于各种事物,力求用精准的数据证实事件的真实性。
4.设计一个Mad Libs游戏
代码截图:
运行结果截图: