zoukankan      html  css  js  c++  java
  • 数据挖掘笔记-01

    数据挖掘步骤:  数据准备  数据探索  模型建立  模型评估  模型部署

    数据挖掘方法分类:  关联  回归  分类  聚类  预测  诊断

    数据准备:  数据收集  数据质量分析  数据预处理

    数据探索:  数据可视化  数据降维  数据统计  衍生变量

    关联方法:  Apriori  FP-Growth

    回归方法:  一元回归  多元回归  逐步回归  Logistic回归

    分类方法:  朴素贝叶斯  SVM支持向量机  神经网络  决策树  KNN近邻  逻辑斯梯模型  分类分析  判别分析

    聚类方法:  K-Means聚类  层次聚类  神经网络  模糊C均值  高斯混合聚类

    预测方法:  灰色预测  马尔科夫预测

    诊断方法:  

      离群点监测:   基于统计   基于距离   基于密度   基于聚类

    时间序列方法:  平稳时间序列方法  季节指数  时间序列模型  

    智能优化方法:  遗传算法  模拟退火算法  蚁群算法

    机器学习:

     数据挖掘 = 机器学习 + 数据仓库  

    模式识别 = 机器学习  

    统计学习 ≈ 机器学习   

    计算机视觉 = 图像处理 + 机器学习  

    语音识别 = 语音处理 + 机器学习  

    自然语言处理 = 文本处理 + 机器学习

    机器学习方法:监督学习、无监督学习:  

    监督学习:   

    回归算法   神经网络 ANN   支持向量机 SVM  

    无监督学习:   聚类算法   降维算法  

    其他学习:   推荐算法

    大数据分析方法:  

    大数据,小分析:OLAP,多维分析思想  

    大数据,大分析:数据挖掘与机器学习  

    流式分析:事件驱动架构  

    查询分析:NoSql分析

    机器学习的子类---》深度学习

    机器学习的父类---》人工智能

  • 相关阅读:
    应用实例-最大子列和问题
    什么是算法
    什么是数据结构
    数据结构与算法-Python/C(目录)
    collections模块
    色彩缤纷的Python(改变字体颜色及样式)
    取数组中一段值的算法(转)
    开发者必备,超实用的PHP代码片段(转)
    php中数组自定义排序
    rand值出现负数的解决方案
  • 原文地址:https://www.cnblogs.com/defineconst/p/5187336.html
Copyright © 2011-2022 走看看