zoukankan      html  css  js  c++  java
  • 数据化运营(1)

        前段时间,boss推荐<数据挖掘与数据化运营实战:思路、方法、技巧与应用>,买来看了一下,觉得里面有很多干货,尽管有关怎么建模,如何建模等深入到算法层面的东西讲的比较少,但是该书站在商业化,业务+技术的角度阐释了该如何做数据挖掘,以下我是用思维导图的方式记录了的笔记(直接从云笔记里面copy过来)

    第三章 常见数据分析模型
     
     
    第四章 数据化运营是跨专业、跨团队的合作
    第五章 主要谈到新手数据分析师常见的错误观念
    1,轻视业务;2,技术万能;3,技术尖端;4,机器万能;
    总的来说要紧密结合业务挖掘有价值的东西。平常思考过程中别把关联关系转化成因果关系
    第六章 一个完整的挖掘案例流程
     
    第七张章 挖掘模型优化跟评价指标
    第八章 常见数据处理技巧
    在数据挖掘领域一个很经典的话是:Garbage In,Garbage Out! 通常一个挖掘任务70%的时间都花在建模前期的工作中。
    第九章 聚类分析的应用
    聚类概念 啪啦啪啦一堆(就不写啦,各种谷歌度娘得到结论)。。。。
    聚类分析技术的常见应用场景
    聚类算法的种类也是多种多样,常用的K均值(k++均值),层次聚类(较慢),谱聚类(基于图结构的),LDA(主题模型,文本类)
    运用聚类分析可能遇到的问题
    1,数据噪声和离群值
         处理方法:删除或者抽样。
    2,数据标准化或者归一化(防止个别数值很大的属性权重大)
    3,距离公式(欧氏、马氏、汉明等等)
  • 相关阅读:
    css bug(ie6兼容问题)
    css样式之vertical-align垂直居中的应用
    css浮动
    样式属性(1)
    DOM对象,控制HTML元素(1)
    用户注册
    Kaggle竞赛 —— 泰坦尼克号(Titanic)
    Spring框架第六篇之Spring与DAO
    Spring框架第五篇之Spring与AOP
    Spring框架第四篇之基于注解的DI注入
  • 原文地址:https://www.cnblogs.com/kobedeshow/p/3548420.html
Copyright © 2011-2022 走看看