zoukankan      html  css  js  c++  java
  • MongoDB教程6-BSON对JSON做了哪些改进

    MongoDB 存储的数据格式与 JSON 十分类似,MongoDB 所采用的数据格式被称为 BSON,是一种基于 JSON 的二进制序列化格式,用于 MongoDB 存储文档并进行远程过程调用。

    JSON 是一种网络常用的数据格式,具有自描述性。JSON 的数据表示方式易于解析,但支持的数据类型有限。BSON 目前主要用于 MongoDB 中,选择 JSON 进行改造的原因主要是 JSON 的通用性及 JSON 的结构特性。

    BSON 改进的主要特性有下面三点。

    更快的遍历速度

    BSON 对 JSON 的一个主要的改进是,在 BSON 元素的头部有一个区域用来存储元素的长度, 当遍历时,如果想跳过某个文档进行读取,就可以先读取存储在 BSON 元素头部的元素的长度, 直接寻找到指定的点上就完成了文档的跳过。

    在 JSON 中,要跳过一个文档进行数据读取,需要在对此文档进行扫描的同时匹配数据结构才可以完成跳过操作。

    操作更简易

    如果要修改 JSON 中的一个值,如将 9 修改为 10,这实际是将一个字符变成了两个,会导致其后面的所有内容都向后移一位。

    在 BSON 中,可以指定这个列为整型,那么,当将 9 修正为 10 时,只是在整型范围内将数字进行修改,数据总长不会变化。

    需要注意的是:如果数字从整型增大到长整型,还是会导致数据总长增加。

    支持更多的数据类型

    BSON 在 JSON 的基础上增加了很多额外的类型,BSON 增加了“byte array”数据类型。这使得二进制的存储不再需要先进行 base64 转换再存为 JSON,减少了计算开销。

    BSON 支持的数据类型如表所示。

    数据类型描述
    String 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。{"x" : "中文"}
    Integer 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 {"x" : 3}
    Boolean 布尔值。用于存储布尔值(真/假), 布尔型有 true 和 false,{"x" : true}
    Double 双精度浮点值。用于存储浮点值。{"x" : 3.14}
    Min/Max keys 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。
    Arrays 用于将数组或列表或多个值存储为一个键。{"x" : ["a", "b", "c"]}
    Timestamp 时间戳。记录文档修改或添加的具体时间。
    Object 用于内嵌文档。文档的值是嵌套文档,{"a" : {"b" : 3}}
    Null 表示空值或者不存在的字段,{"x" : null}
    Symbol 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。
    Date 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。
    Object ID 对象 ID。用于创建文档的 ID。对象 id 是一个 12 字节的字符串,是文档的唯一标识,{"x" : objectId()}
    Binary Data 二进制数据:二进制数据是一个任意字节的字符串。它不能直接在 Shell 中使用。如果要将非 UTF-8 字符保存到数据库中,二进制数据是唯一的方式
    Code 代码类型。用于在文档中存储 JavaScript 代码。
    Regular expression 正则表达式类型。用于存储正则表达式。{"x" : /[cba]/}
  • 相关阅读:
    K8s 使用 nfs-client-provisioner
    MySQL IF CASE 例子
    Nginx 限速
    Python 元组操作
    Python if, while,for,continue,break,三目运算符
    Centos7 安装 pyenv
    MySQL 查看大事务
    Tomcat 修改日志路径及日志分割
    游戏攻略 美少女万华镜5
    自建远程桌面过程 vnc + frp
  • 原文地址:https://www.cnblogs.com/no-celery/p/13601291.html
Copyright © 2011-2022 走看看