zoukankan      html  css  js  c++  java
  • IntroductionToDataMining章1绪论_by二卷

    keywords: 数据挖掘

    author: 二卷(2017.03.07)


    这章没啥,就是二卷对着书边看边自言自语了一通。
    在绪论的开篇,书里提到,数据挖掘也会用于分子生物学,二卷其实就是药学院的,虽然不是研究基因,但是还是好感动啊,我对医药有特殊的感情。


    ## **
    1.什么是数据挖掘
    ** 书上说的很多,二卷认为数据挖掘是从一堆数据中挖掘出有用的模式,这些数据通常存放在数据库中。在数据挖掘之前会做一些预处理,比如清洗数据、整理数据的存储格式;在这些数据被挖掘后,再进行后处理,得到一些直观有用的信息。
    ## **
    2.数据挖掘要解决的问题
    ** 就二卷现在研究僧所研究的专业方向来看,数据挖掘并不是万能的,还有很多问题它并不能很好的解决,尤其是生物体内一些微观世界的复杂问题。所以说,数据挖掘还需要解决自身的很多问题,书上有说,但是不是二卷学习的重点,跳过。
    ## **
    3.数据挖掘的起源
    ** 起源嘛,肯定是现有的技术不足以解决现在的问题,所以需要发展新的技术方法。数据挖掘的学习需要统计学的背景,同时也需要建模方面的知识,还需要IT技术方面的支持。
    ## **
    4.数据挖掘任务
    ** 可以分为俩大类:**预测任务** 、**描述任务**
    本书主要讲四种数据挖掘的任务: ### **1)预测建模** 主要有分类(用于离散的数据)和回归(用于连续的数据) ### **2)关联分析** ### **3)聚类分析** ### **4)异常检测**
    (从字面含义就可以大概知道这四种任务是做什么的,但是我认为为了完成一个好的数据挖掘,可能需要交叉使用这四种方法。还有就是数据挖掘有时候得到的模型并不一定是完全准确的,但是已经尽可能的贴近现实情况)




    -------------------------------------------我是求打赏的分割线-------------------------------------------

    大海中的一颗星辰,天空中的一枚卷花

    作者:二卷

    出处:http://www.cnblogs.com/erjuan/

    本文版权归二卷和博客园共有,欢迎转载,但未经二卷同意必须保留此段声明哦,且在文章页面位置给出二卷的原文连接

    有错误的话也可以联系二卷指正哦(鞠躬)

  • 相关阅读:
    Windows JScript 在 游览器 中运行 调试 Shell 文件系统
    autohotkey 符号链接 软连接 symbolink
    软链接 硬链接 测试
    SolidWorks 修改 基准面 标准坐标系
    手机 路径 WebDAV 映射 驱动器
    Win10上手机路径
    explorer 命令行
    单位公司 网络 封锁 屏蔽 深信 AC
    cobbler自动化部署原理篇
    Docker四种网络模式
  • 原文地址:https://www.cnblogs.com/erjuan/p/6516429.html
Copyright © 2011-2022 走看看