zoukankan      html  css  js  c++  java
  • 结构化、半结构化和非结构化数据

    在实际应用中,我们会遇到各式各样的数据库如nosql非关系数据库(memcached,redis。mangodb)。RDBMS关系数据库(oracle,mysql等),另一些其他的数据库如hbase,在这些数据库中。又会出现结构化数据。非结构化数据。半结构化数据,以下列出各种数据类型:

    结构化数据:
    可以用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号。传统的关系数据模型、行数据,存储于数据库,可用二维表结构表示。

    半结构化数据:
    所谓半结构化数据。就是介于全然结构化数据(如关系型数据库、面向对象数据库中的数据)和全然无结构的数据(如声音、图像文件等)之间的数据,XML、HTML文档就属于半结构化数据。它通常是自描写叙述的,数据的结构和内容混在一起,没有明显的区分。


    非结构化数据:
    非结构化数据库是指其字段长度可变,并且每一个字段的记录又能够由可反复或不可反复的子字段构成的数据库,用它不仅能够处理结构化数据(如数字、符号等信息)并且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。
    非结构化数据,包含全部格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等
  • 相关阅读:
    3.5.3 数据排序;重复数值、缺失值处理
    3.5.1 pandas基础
    3.3 numpy
    数据准备和特征工程
    2.4函数
    2.3语句与控制流
    2.2数据结构与序列
    2.1Python基础知识
    五、MySQL安装
    四、Hadoop HA 集群搭建
  • 原文地址:https://www.cnblogs.com/gavanwanggw/p/6914060.html
Copyright © 2011-2022 走看看