zoukankan      html  css  js  c++  java
  • 了解大数据的特点、来源于数据呈现方式

    本次的作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620

    一、浏览2019春节各种大数据分析报告,例如:

    二、分析所采用数据的来源有哪些?

    大数据分析的数据来源有很多种,包括公司或者机构的内部来源和外部来源。分为以下几类:

    1、交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。

    2、移动通讯数据。智能手机等移动设备。

    3、机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。

    4、互联网上的“开放数据”来源,如政府机构,非营利组织和企业免费提供的数据。

    5、人为数据即通过人类行为产生的数据。如电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书等社交媒体产生的数据流。

    三、大数据的呈现方式有哪些?

    呈现方式有条状图、box框线图、饼状图、线状图和词云等

    四、大数据的特点是什么?对思维方式有何影响?

    1. 数据量大(Variety),TB,PB,乃至EB等数据量的数据需要分析处理。

    2.数据类型繁多(Variety),不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据。

    3.价值密度低(Value),由于数据采集的不及时,数据样本不全面,数据可能不连续等等,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。

    4.处理速度快(Velocity),快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”。

    五、准备python编程环境

    下载安装

    https://www.python.org/

    https://www.jetbrains.com/pycharm/download/#section=windows 

    基础学习

    廖雪峰https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000  

    菜鸟教程http://www.runoob.com/python3/python3-tutorial.html 

    六、简单的输入输出编程练习

    设计完成一个Mad Libs游戏

  • 相关阅读:
    显示多行字符串
    dowhile
    获取系统的相关文件夹
    DLL 实际应用版本
    ShellExecute
    LoadLibrary
    MFC DLL的创建
    在DLL中存放资源
    替换字符串
    RemoveDirectoryB
  • 原文地址:https://www.cnblogs.com/zl1216/p/10436081.html
Copyright © 2011-2022 走看看