zoukankan      html  css  js  c++  java
  • 数据挖掘-为什么进行数据挖掘

    为什么进行数据挖掘?

    1. 进入信息时代(信息时代数据量暴增)

    社会计算机化和功能强大的数据收集和存储工具导致数据的爆炸式增长;
    数据的爆炸式增长、广泛可用和巨大数量使得当前时代成为真正的数据时代;
    急需功能强大和通用的工具,以便从这些海量数据中发现有价值的信息,把这些数据转化成有组织的知识。

    2. 数据挖掘是信息技术的进化(数据暴增存储后,需要有工具进行数据分析)

    数据库和数据管理产业在一些关键功能的开发商不断发展:数据收集和数据库创建、数据管理(包括数据存储和检索数据库事务处理)和高级数据分析(包括数据仓库和数据挖掘)。
    自20世纪60年代以来,数据库和信息技术已经系统的从原始的文件处理演变成复杂的、功能强大的数据库系统。
    自20世纪70年代以来,数据库系统的研究和开发已经从开发层次和网状数据库发展到开发关系数据库系统(数据存放在关系表结构中)、数据建模工具、索引和存取方法。此外,用户通过查询语言、用户界面、查询处理优化和事务管理,可以方便、灵活的访问数据。
    联机事务处理(OLTP)的有效方法将查询看做只读事务,对于关系技术的发展以及把关系技术作为大量数据的有效存储、检索和管理的主要工具做出了重要贡献。
    数据库管理系统建立之后,数据库技术就转向高级数据库系统、支持高级数据分析的数据仓库和数据挖掘、基于Web的数据库。这些系统体现了新的、功能强大的数据模型,如扩充关系的、面向对象的、对象-关系的和演绎的模型。
    高级数据分析源于20世纪80年代的后期。在过去的30年中,计算机硬件的进步,导致了性价比较高的计算机、数据收集设备和存储介质的大量供应。这些技术大大推动了数据库和信息产业的发展,是的大量数据库和信息存储库用于事务管理、信息检索和数据分析。
    最近出现的一种数据存储结构是数据仓库。这是一种多个异构数据源在单个站点以统一的模式组织的存储,以支持管理决策。数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)。
    OLAP是一种分析技术,具有汇总、合并和聚集以及从不同的角度观察信息的能力。
    快速增长的海量数据收集、存放在大量的大型数据库中,没有强有力的工具,理解他们已经远远超出了人的能力,导致 数据丰富但信息贫乏。数据和信息之间的鸿沟越来越宽,这就要求必须系统的开发数据挖掘工具,将数据转换成有用的信息。

  • 相关阅读:
    【转载】jyupter notebook入门指南
    【转载】CnBlogs博文排版
    【转载】如何知道自己适合做什么
    【转载】讲真,认知几乎是人和人之间唯一的本质差别。
    Geekband C++面向对象高级程序设计-第六周课程5
    Geekband C++面向对象高级程序设计-第六周课程3
    Outlier实验-补充记录1
    Outlier实验-出错记录1
    Geekband C++面向对象高级程序设计-第六周课程2
    Geekband C++面向对象高级程序设计-第六周课程1
  • 原文地址:https://www.cnblogs.com/EnzoDin/p/10673936.html
Copyright © 2011-2022 走看看