zoukankan      html  css  js  c++  java
  • IntroductionToDataMining章1绪论_by二卷

    keywords: 数据挖掘

    author: 二卷(2017.03.07)


    这章没啥,就是二卷对着书边看边自言自语了一通。
    在绪论的开篇,书里提到,数据挖掘也会用于分子生物学,二卷其实就是药学院的,虽然不是研究基因,但是还是好感动啊,我对医药有特殊的感情。


    ## **
    1.什么是数据挖掘
    ** 书上说的很多,二卷认为数据挖掘是从一堆数据中挖掘出有用的模式,这些数据通常存放在数据库中。在数据挖掘之前会做一些预处理,比如清洗数据、整理数据的存储格式;在这些数据被挖掘后,再进行后处理,得到一些直观有用的信息。
    ## **
    2.数据挖掘要解决的问题
    ** 就二卷现在研究僧所研究的专业方向来看,数据挖掘并不是万能的,还有很多问题它并不能很好的解决,尤其是生物体内一些微观世界的复杂问题。所以说,数据挖掘还需要解决自身的很多问题,书上有说,但是不是二卷学习的重点,跳过。
    ## **
    3.数据挖掘的起源
    ** 起源嘛,肯定是现有的技术不足以解决现在的问题,所以需要发展新的技术方法。数据挖掘的学习需要统计学的背景,同时也需要建模方面的知识,还需要IT技术方面的支持。
    ## **
    4.数据挖掘任务
    ** 可以分为俩大类:**预测任务** 、**描述任务**
    本书主要讲四种数据挖掘的任务: ### **1)预测建模** 主要有分类(用于离散的数据)和回归(用于连续的数据) ### **2)关联分析** ### **3)聚类分析** ### **4)异常检测**
    (从字面含义就可以大概知道这四种任务是做什么的,但是我认为为了完成一个好的数据挖掘,可能需要交叉使用这四种方法。还有就是数据挖掘有时候得到的模型并不一定是完全准确的,但是已经尽可能的贴近现实情况)




    -------------------------------------------我是求打赏的分割线-------------------------------------------

    大海中的一颗星辰,天空中的一枚卷花

    作者:二卷

    出处:http://www.cnblogs.com/erjuan/

    本文版权归二卷和博客园共有,欢迎转载,但未经二卷同意必须保留此段声明哦,且在文章页面位置给出二卷的原文连接

    有错误的话也可以联系二卷指正哦(鞠躬)

  • 相关阅读:
    Eclipse(MyEclipse)使用技巧——改动凝视字体大小
    C++标准库之 Lower_Bound, upper_Bound
    Mongodb地理空间索引
    AfxMessageBox和MessageBox差别
    具体解释VB中连接access数据库的几种方法
    C++中this指针的使用方法.
    秒杀多线程第四篇 一个经典的多线程同步问题
    设计模式学习03—抽象工厂模式
    Neutron中的Service类
    Opencv学习笔记(六)SURF学习笔记
  • 原文地址:https://www.cnblogs.com/erjuan/p/6516429.html
Copyright © 2011-2022 走看看