zoukankan      html  css  js  c++  java
  • 大数据入门学习(一):初识大数据

    大数据的定义

      大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。

    大数据的特点

      ♦ 数据体量巨大:单一数据集的大小从数太字节(TB)至数十兆亿字节(PB)不等。

      ♦ 数据类型多样:数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。

      ♦ 处理速度快:数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。

      ♦ 价值密度低:单位数据的价值比较低,当海量的数据汇聚到一起时才能产出重要的数据。

    注:“1秒定律”或者秒级定律,就是说对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值了.这个速度要求是大数据处理技术和传统的数据挖掘技术最大的区别.
  • 相关阅读:
    作业:利用正则表达式知识, 编辑一个简单的表达式计算器
    正则表达式:内置re模块
    HTML5笔记
    安卓开发-intent在Activity之间数据传递
    NumPy-矩阵部分
    Jupyter notebook入门
    Anaconda入门教程
    在python2里面使用python3的print
    判断浏览器是不是支持html5
    python爬虫-html解析器beautifulsoup
  • 原文地址:https://www.cnblogs.com/weilan/p/9262472.html
Copyright © 2011-2022 走看看