zoukankan      html  css  js  c++  java
  • 第七周作业:关于我对大数据的两点误解

        上周在写一份材料时,其中写到了“将大数据技术更好地应用于高校就业指导与服务”,后来在上交材料时,老师问我“你知道大数据”是指什么吗?当时我只知道应该就是指数据多、信息量大吧,后来老师给我做了一些简单的解释,我才明白原来并不是我想的那样。

        作为一个计算机系的学生,对此是应该了解的,于是我查了一些有关大数据的资料来加深我的理解。

    以下是我以前的两点误解:

    1.数据不等于信息

        数据指的是一个原始的数据点,信息则直接与内容挂钩,数据多,不一定就代表信息多。比如我们玩微博的时候,有时会转发别人的微博,有时会看到很多相似的微博,虽然文字内容会有所不同,但表达的意义却是一样的,此时,虽然数据增多,但信息量并没有增加。

    2.信息不等于智慧

        即使除去数据中重复的部分,最后所剩下的数据也不一定有用,信息要转变为智慧,至少需要满足以下三个标准:

    可破译性:人们的行为使得每天会产生大量的信息,在未对信息处理分析之前,一般将这些数据暂时非结构化的存储起来,这些非结构化的数据不一定可破译。比如我们在逛淘宝时,阿里的系统可能会将用户的操作过程,在某网页的浏览时间等记录下来,比如记录客户3次切换物品的时间间隔分别为5秒、10秒、17秒,但却只记录了5秒、10秒、17秒,忘记标注这些时间代表的是什么,那么我们无法对这些数据处理分析,即不可破译,因此不能成为智慧。

    关联性:无关的信息,至多只是噪音,比如当阿里想分析逛淘宝的用户喜欢进的店铺类型,物品类型时,这时用户切换网页的时间信息对其就是无关的,而用户打开的店铺链接及物品链接则是有关的。

    新颖性:新颖性很多时候无法根据我们手上的数据和信息进行判断,(继续上面的例子)比如我们用不同组数据得出了客户喜欢的店铺类型和物品类型,那么后者就是不具有新颖性的,然而,我们往往需要将大量的数据和信息处理之后,才能得知其是否具有新颖性。

    大数据应用案例之:零售业以下数据来源于网页http://wiki.mbalib.com/wiki/大数据)

          "我们的某个客户,是一家领先的专业时装零售商,通过当地的百货商店、网络及其邮购目录业务为客户提供服务。公司希望向客户提供差异化服务,如何定位公司的差异化,他们通过从 Twitter 和 Facebook 上收集社交信息,更深入的理解化妆品的营销模式,随后他们认识到必须保留两类有价值的客户:高消费者和高影响者。希望通过接受免费化妆服务,让用户进行口碑宣传,这是交易数据与交互数据的完美结合,为业务挑战提供了解决方案。"Informatica的技术帮助这家零售商用社交平台上的数据充实了客户主数据,使他的业务服务更具有目标性。

      [2] 零售企业也监控客户的店内走动情况以及与商品互动。它们将这些数据与交易记录相结合来展开分析,从而在销售哪些商品、如何摆放货品以及何时调整售价上给出意见,此类方法已经帮助某领先零售企业减少了17%的存货,同时在保持市场份额的前提下,增加了高利润率自有品牌商品的比例。

     

     

  • 相关阅读:
    Ubuntu12.04安装svn1.8
    [NOIP模拟测试3] 建造游乐园 题解(欧拉图性质)
    图论模板
    [bzoj3073] Journeys 题解(线段树优化建图)
    [bzoj3033]太鼓达人 题解(搜索)
    [NOIP2016]天天爱跑步 题解(树上差分) (码长短跑的快)
    [HNOI2015]菜肴制作 题解(贪心+拓扑)
    [SDOI2015]排序 题解 (搜索)
    [CQOI2011]放棋子 题解(dp+组合数学)
    [ZJOI2011]看电影(组合数学/打表+高精)
  • 原文地址:https://www.cnblogs.com/herosmiling/p/5414369.html
Copyright © 2011-2022 走看看