zoukankan      html  css  js  c++  java
  • MongoDB性能优化

    一、索引

    MongoDB 提供了多样性的索引支持,索引信息被保存在system.indexes 中,且默认总是为_id创建索引,它的索引使用基本和MySQL 等关系型数据库一样。其实可以这样说说,索引是凌驾于数据存储系统之上的另一层系统,所以各种结构迥异的存储都有相同或相似的索引实现及使用接口并不足为 奇。

    1.基础索引

    在字段age 上创建索引,1(升序);-1(降序):

    db.users.ensureIndex({age:1})

    _id 是创建表的时候自动创建的索引,此索引是不能够删除的。当系统已有大量数据时,创建索引就是个非常耗时的活,我们可以在后台执行,只需指定“backgroud:true”即可。

    db.t3.ensureIndex({age:1} , {backgroud:true})

    2.文档索引

    索引可以任何类型的字段,甚至文档:

     
    db.factories.insert( { name: "wwl", addr: { city: "Beijing", state: "BJ" } } );
    //在addr 列上创建索引
    db.factories.ensureIndex( { addr : 1 } );
    //下面这个查询将会用到我们刚刚建立的索引
    db.factories.find( { addr: { city: "Beijing", state: "BJ" } } );
    //但是下面这个查询将不会用到索引,因为查询的顺序跟索引建立的顺序不一样
    db.factories.find( { addr: { state: "BJ" , city: "Beijing"} } );
     

    3. 组合索引

    跟其它数据库产品一样,MongoDB 也是有组合索引的,下面我们将在addr.city 和addr.state上建立组合索引。当创建组合索引时,字段后面的1 表示升序,-1 表示降序,是用1 还是用-1 主要是跟排序的时候或指定范围内查询 的时候有关的。

    db.factories.ensureIndex( { "addr.city" : 1, "addr.state" : 1 } );
    // 下面的查询都用到了这个索引
    db.factories.find( { "addr.city" : "Beijing", "addr.state" : "BJ" } );
    db.factories.find( { "addr.city" : "Beijing" } );
    db.factories.find().sort( { "addr.city" : 1, "addr.state" : 1 } );
    db.factories.find().sort( { "addr.city" : 1 } )

    4. 唯一索引

    只需在ensureIndex 命令中指定”unique:true”即可创建唯一索引。例如,往表t4 中插入2 条记录:

    db.t4.ensureIndex({firstname: 1, lastname: 1}, {unique: true});

    5.强制使用索引

    hint 命令可以强制使用某个索引。

    db.t5.find({age:{$lt:30}}).hint({name:1, age:1}).explain()

    6.删除索引

    //删除t3 表中的所有索引
    db.t3.dropIndexes()
    //删除t4 表中的firstname 索引
    db.t4.dropIndex({firstname: 1})

    二、explain执行计划

    MongoDB 提供了一个 explain 命令让我们获知系统如何处理查询请求。利用 explain 命令,我们可以很好地观察系统如何使用索引来加快检索,同时可以针对性优化索引。

     
      db.t5.ensureIndex({name:1})
      db.t5.ensureIndex({age:1})
      db.t5.find({age:{$gt:45}}, {name:1}).explain()
      {
          "cursor" : "BtreeCursor age_1",
          "nscanned" : 0,
          "nscannedObjects" : 0,
          "n" : 0,
          "millis" : 0,
          "nYields" : 0,
          "nChunkSkips" : 0,
          "isMultiKey" : false,
          "indexOnly" : false,
          "indexBounds" : {
          "age" : [
                        [45,1.7976931348623157e+308]
                    ]
           }
    }
     

    字段说明:

    • cursor: 返回游标类型(BasicCursor 或 BtreeCursor)
    • nscanned: 被扫描的文档数量
    • n: 返回的文档数量
    • millis: 耗时(毫秒)
    • indexBounds: 所使用的索引

    三、优化器profile

    在MySQL 中,慢查询日志是经常作为我们优化数据库的依据,那在MongoDB 中是否有类似的功能呢?答案是肯定的,那就是MongoDB Database Profiler。

    1.开启profiling功能

    有两种方式可以控制 Profiling 的开关和级别,第一种是直接在启动参数里直接进行设置。启动MongoDB 时加上–profile=级别 即可。也可以在客户端调用db.setProfilingLevel(级别) 命令来实时配置,Profiler 信息保存在system.profile 中。我们可以通过db.getProfilingLevel()命令来获取当前的Profile 级别,类似如下操作:

    db.setProfilingLevel(2);

    上面profile 的级别可以取0,1,2 三个值,他们表示的意义如下:

    1. 0 – 不开启
    2. 1 – 记录慢命令 (默认为>100ms)
    3. 2 – 记录所有命令

    Profile 记录在级别1 时会记录慢命令,那么这个慢的定义是什么?上面我们说到其默认为100ms,当然有默认就有设置,其设置方法和级别一样有两种,一种是通过添加 –slowms 启动参数配置。第二种是调用db.setProfilingLevel 时加上第二个参数:

    db.setProfilingLevel( level , slowms )
    db.setProfilingLevel( 1 , 10 );

    2.查询 Profiling 记录

    与MySQL 的慢查询日志不同,MongoDB Profile 记录是直接存在系统db 里的,记录位置system.profile ,所以,我们只要查询这个Collection 的记录就可以获取到我们的 Profile 记录了。列出执行时间长于某一限度(5ms)的 Profile 记录:

    db.system.profile.find( { millis : { $gt : 5 } } )

    MongoDB Shell 还提供了一个比较简洁的命令show profile,可列出最近5 条执行时间超过1ms 的 Profile 记录。  

    四、常用性能优化方案

    1. 创建索引
    2. 限定返回结果数
    3. 只查询使用到的字段
    4. 采用capped collection
    5. 采用Server Side Code Execution
    6. 使用Hint,强制使用索引
    7. 采用Profiling

    五、性能监控工具

    1. mongosniff

    此工具可以从底层监控到底有哪些命令发送给了MongoDB 去执行,从中就可以进行分析:以root 身份执行:

    $./mongosniff --source NET lo

    然后其会监控位到本地以localhost 监听默认27017 端口的MongoDB 的所有包请求。

    2.Mongostat

    此工具可以快速的查看某组运行中的MongoDB 实例的统计信息 字段说明:

    • insert: 每秒插入量
    • query: 每秒查询量
    • update: 每秒更新量
    • delete: 每秒删除量
    • locked: 锁定量
    • qr | qw: 客户端查询排队长度(读|写)
    • ar | aw: 活跃客户端量(读|写)
    • conn: 连接数
    • time: 当前时间

    它每秒钟刷新一次状态值,提供良好的可读性,通过这些参数可以观察到一个整体的性能情况。

    3. db.serverStatus

    这个命令是最常用也是最基础的查看实例运行状态的命令之一。

    4.db.stats

  • 相关阅读:
    SQLServer如何批量替换某一列中的某个字符串
    能成为一名合格的Java架构师
    来看看Uber的司机支持服务签到及预约系统的架构设计思路
    什么是三层架构?你真的理解分层的意义吗?
    京东7Fresh新零售架构设计分析
    解密京东千亿商品系统核心架构
    因特尔黑科技:黑暗中快速成像系统
    分布式缓存架构设计
    各种排序算法汇总小结
    系统架构设计之-任务调度系统的设计
  • 原文地址:https://www.cnblogs.com/metoy/p/5218850.html
Copyright © 2011-2022 走看看