zoukankan      html  css  js  c++  java
  • 数据思维

    数据产业核心任务:数据产生价值(可被产品化的商业价值)
    三个关键环节:数据业务定义、数据分析与建模、数据业务实施
    三个关键词:收入、支出(控制成本)、风险      重要因素:可以量化的参照系
    精确定位,有的放矢   更好的决策分析
    受众主体:企业、政府
    预测不准是常态,但可以提供价值
    统计学:回归分析
    分类:线性回归、0—1回归(性别)、定序回归(豆瓣电影评分)、计数回归(RFM模型:一定时间内客户到访次数)、生存回归(灯泡使用寿命、应用于市场营销、人力资源)
    • 回归分析要去识别并判断,哪些X变量是同Y真的相关,哪些不是。
    • 有用的X变量同Y的相关关系是正的还是负的。
    • 赋予不同X不同的权重,也就是不同的回归系数,进而可
    • 以知道不同变量之间的相对重要性。
    大多数客户是说不清自己的需求的。
    要理解数据之于客户的价值,得首先摸清楚客户的盈利模式。
    发展产业:互联网和制造业
     
    图标展示:直观、精准、匹配
    若是竖着的柱子,称为柱状图;若是横着的柱子,称作条形图。
     
    机器学习涉及到的模型属于非线性的
    分类:朴素贝叶斯分类、决策树、回归树(和决策树区别:使用连续型因变量的数据。应用组合:随机森林与XGBoost)与提升算法、K均值聚类(搜索引擎广告投放)
    深度学习——卷积神经网络(CNN)
    线性回归的测试集与训练集展现了较高的一致性
     
    为什么单身:吸引力和共同爱好
    从古至今,很多重要的进步都是游戏激发的。
    打麻将的本质,就是每一轮做决策。
     
    数据是不是非结构化的,是一个相对的甚至是带有主观色彩的概念。
    数据分析经验和数据挖掘能力、使用各种统计分析软件
    职场五维评分(不分先后顺序):学历、经验、职业素养、专业技能、软件
     
    RFMS模型:
    recency:最近一次消费间隔的时间
    feequency:最近一段时间购买次数
    monetary:某段时间内消费金额
    standard  deviation  某段时间内消费金额标准差
  • 相关阅读:
    【转】简单地用nfs实现linux间文件共享
    CentOS 6.1上部署SVN时遇到的问题及解决方法
    ubuntu下部署SVN服务
    LINUX GBK>UTF8文件编码批量转换脚本[转]
    Thinkpad E420 3YC(双显卡)安装64位Ubuntu 11.10笔记
    拦截器详解
    快排的算法
    冒泡排序的算法
    struts2的输入校验
    ssh整合开发
  • 原文地址:https://www.cnblogs.com/bkyf/p/10849674.html
Copyright © 2011-2022 走看看