zoukankan      html  css  js  c++  java
  • MongoDB优化之二:常见优化方法--待整理

    <!-- mongodb访问实例工程类-->
        <mongo:mongo host="${mongo.location}" port="${mongo.port}">
        <mongo:options
        connections-per-host="100"
       threads-allowed-to-block-for-connection-multiplier="10"
       connect-timeout="10000"
       max-wait-time="120000"
       auto-connect-retry="false"
       socket-keep-alive="false"
       socket-timeout="0"
       slave-ok="false"
       write-number="1"
       write-timeout="0"
       write-fsync="true"
        />
        </mongo:mongo>
    <mongo:db-factory mongo-ref="mongo"
       dbname="${mongo.dbName}" username="${mongo.username}" password="${mongo.password}" id="mongoDbFactory" />
    <bean id="mongoTemplate" class="org.springframework.data.mongodb.core.MongoTemplate">
       <constructor-arg name="mongoDbFactory" ref="mongoDbFactory" />
    </bean>

    各个参数说明:

    #对mongo实例来说,每个host允许链接的最大链接数,这些链接空闲时会放入池中,如果链接被耗尽,任何请求链接的操作会被阻塞等待链接可用,推荐配置10
    connectionsPerHost=10
    #当链接空闲时,空闲线程池中最大链接数
    minPoolsSize=5
    #此参数跟connectionsPerHost的乘机为一个线程变为可用的最大阻塞数,超过此乘机数之后的所有线程将及时获取一个异常.eg.connectionsPerHost=10 and threadsAllowedToBlockForConnectionMultiplier=5,最多50个线程等级一个链接,推荐配置为5
    threadsAllowedToBlockForConnectionMultiplier=5
    #一个线程等待链接可用的最大等待毫秒数,0表示不等待,负数表示等待时间不确定,推荐配置120000
    maxWaitTime=120000
    #链接超时的毫秒数,0表示不超时,此参数只用在新建一个新链接时,推荐配置10,000.
    connectTimeout=10000
    #此参数表示socket I/O读写超时时间,推荐为不超时,即 0    Socket.setSoTimeout(int)
    socketTimeout=0
    #该标志用于控制socket保持活动的功能,通过防火墙保持连接活着
    socketKeepAlive=false
    #true:假如链接不能建立时,驱动将重试相同的server,有最大的重试次数,默认为15次,这样可以避免一些server因为一些阻塞操作零时down而驱动抛出异常,这个对平滑过度到一个新的master,也是很有用的,注意:当集群为复制集时,驱动将在这段时间里,尝试链接到旧的master上,而不会马上链接到新master上
    #false 当在进行socket读写时,不会阻止异常抛出,驱动已经有自动重建破坏链接和重试读操作. 推荐配置false
    autoConnectRetry=false
    #重新打开链接到相同server的最大毫秒数,推荐配置为0,如果 autoConnectRetry=true,表示时间为15s
    #com.jd.mongodbclient2.mongo.JDClientMongo.maxAutoConnectRetryTime=false
    #表示当没有手动关闭游标时,是否有一个自动释放游标对象的方法,如果你总是很小心的关闭游标,则可以将其设为false 推荐配置true

    #com.jd.mongodbclient2.mongo.JDClientMongo.cursorFinalizerEnabled=true

    #安全模式

    com.jd.mongodbclient2.driver.MongoDBDriver.safe=true
    #为true表示读写分离

    com.jd.mongodbclient2.driver.MongoDBDriver.slaveOk=false

    1. MongoClientOptions中的连接池配置:

    配置如下:

    复制代码
    connectionPoolSettings = ConnectionPoolSettings.builder()
                                                           .minSize(getMinConnectionsPerHost())
                                                           .maxSize(getConnectionsPerHost())
                                                           .maxWaitQueueSize(getThreadsAllowedToBlockForConnectionMultiplier()
                                                                             * getConnectionsPerHost())
                                                           .maxWaitTime(getMaxWaitTime(), MILLISECONDS)
                                                           .maxConnectionIdleTime(getMaxConnectionIdleTime(), MILLISECONDS)
                                                           .maxConnectionLifeTime(getMaxConnectionLifeTime(), MILLISECONDS)
                                                           .build();
    复制代码

    minSize: 线程池空闲时保持的最小连接数, 默认是0.

    maxSize: 线程池允许的最大连接数,默认是100.

    maxWaitQueueSize: 线程池等待队列的大小, 默认是500.

    maxWaitTime: 线程等待连接变为可用的最长时间.默认为2分钟. 值为0意味着它不会等待. 负值意味着它将无限期地等待

    maxConnectionIdleTime: 线程池中连接的最大空闲时间, 0标志Udine空闲时间没有限制,超过这个时间会被关闭.

    maxConnectionLifeTime: 线程池中连接的最长生存时间. 0表示没有限制. 超过寿命的会被关闭,必要时通过新连接进行替换.

    2. MongoClientOptions初始化

    mongodb驱动中 MongoClientOptions 使用Buidler模式配置,有关所有属性的默认值,都是在Builder里边配置的.

    关于Builder 的配置如下:

    复制代码
        public static class Builder {
            private String description;
            private String applicationName;
            //读取偏好, 这里默认的是从主节点读取.
            private ReadPreference readPreference = ReadPreference.primary();
            //使用服务器默认的写关注?
            private WriteConcern writeConcern = WriteConcern.ACKNOWLEDGED;
            //使用服务的默认读关注,默认是local
            private ReadConcern readConcern = ReadConcern.DEFAULT;
            private CodecRegistry codecRegistry = MongoClient.getDefaultCodecRegistry();
            private final List<CommandListener> commandListeners = new ArrayList<CommandListener>();
            private final List<ClusterListener> clusterListeners = new ArrayList<ClusterListener>();
            private final List<ServerListener> serverListeners = new ArrayList<ServerListener>();
            private final List<ServerMonitorListener> serverMonitorListeners = new ArrayList<ServerMonitorListener>();
    
            private int minConnectionsPerHost;
            private int maxConnectionsPerHost = 100;
            private int threadsAllowedToBlockForConnectionMultiplier = 5;
            //设置服务器选择超时(以毫秒为单位),它定义驱动程序在抛出异常之前等待服务器选择成功的时间
            //值为0表示如果没有可用的服务器,它将立即超时。 负值意味着无限期等待
            private int serverSelectionTimeout = 1000 * 30;
            //线程等待连接变为可用的最长时间
            private int maxWaitTime = 1000 * 60 * 2;
            // 线程池中连接的最大空闲时间
            private int maxConnectionIdleTime;
            private int maxConnectionLifeTime;
            //连接超时时间,必须大于0
            private int connectTimeout = 1000 * 10;
            //socket超时时间
            private int socketTimeout = 0;
            //socket是否保活
            private boolean socketKeepAlive = false;
            private boolean sslEnabled = false;
            private boolean sslInvalidHostNameAllowed = false;
            private boolean alwaysUseMBeans = false;
            //设置心跳频率。 这是驱动程序将尝试确定群集中每个服务器的当前状态的频率。 默认值为10,000毫秒
            private int heartbeatFrequency = 10000;
            //设置最小心跳频率。 如果驱动程序必须经常重新检查服务器的可用性,它将至少在上一次检查后等待很长时间,以避免浪费精力。 默认值为500毫秒。
            private int minHeartbeatFrequency = 500;
            //设置用于集群心跳的连接的连接超时
            private int heartbeatConnectTimeout = 20000;
            //设置用于集群心跳的连接的套接字超时
            private int heartbeatSocketTimeout = 20000;
            //本地阈值
            private int localThreshold = 15;
    
            private String requiredReplicaSetName;
            private DBDecoderFactory dbDecoderFactory = DefaultDBDecoder.FACTORY;
            private DBEncoderFactory dbEncoderFactory = DefaultDBEncoder.FACTORY;
            private SocketFactory socketFactory;
            private boolean cursorFinalizerEnabled = true;
    ...}
    复制代码

    3. 需要关心的配置

    这里就因人而异了, 我这列出比较重要的几个配置,具体的值看业务场景.

     3.1 读写相关

    这应该是程序最应该关注的配置了,读关注,写关注,读取偏好.

    //读取偏好, 首先从从节点读取.
    private ReadPreference readPreference = ReadPreference.secondaryPreferred();
    //写关注为1 ,写入主节点即返回.
    private WriteConcern writeConcern = WriteConcern.W1;
    //使用服务的默认读关注,默认是local(决定到某个读取数据时,能读到什么样的数据)
    private ReadConcern readConcern = ReadConcern.LOCAL;

    3.2 线程池配置

    //线程池空闲时保持的最小连接数

    minConnectionsPerHost=20

    //线程池允许的最大连接数

    connectionsPerHost=100

    //connectionsPerHost* 5 =最大队列数

    threadsAllowedToBlockForConnectionMultiplier=5

    //线程池中连接的最大空闲时间,5分钟

    maxConnectionIdleTime = 5*60*1000

     // 线程池中连接的最长生存时间,采用默认值

    maxConnectionLifeTime

    3.3 连接配置

    //设置服务器选择超时(以毫秒为单位),它定义驱动程序在抛出异常之前等待服务器选择成功的时间
    //值为0表示如果没有可用的服务器,它将立即超时。 负值意味着无限期等待
    private int serverSelectionTimeout = 1000 * 30;

    //连接超时时间,必须大于0
    private int connectTimeout = 1000 * 5;

    //线程等待连接变为可用的最长时间.

    maxWaitTime=6000

    这里建议 这两个参数: maxWaitTime,connectTimeout,根据公司具体的业务来..

    四个方面进行 cpu/io 方面的优化处理:

    1.集群架构上进行读写分离。所有查询优先考虑在从库上读取,写操作在主库上执行。避免主库混合读写压力过大,也减少主库上读写记录的锁冲突。

    connection string中readPreference 设置成secondarypreferred,C++ 驱动版本升级为3.1.3 mongo-cxx-driver(驱动升级,读写分离才生效) 。

    2.热表msg_traces 索引优化

    针对该慢查询创建联合索引 {"_id": 1, "account": 1, "app_key": 1, "s_pc": 1}。

    3.mongodb 历史数据归档和删除

    和开发同事沟通,根据实际业务需求,保留msgs、msg_traces 集合中一年左右的文档。在timestamp 字段上创建TTL索引。设置文档的过期时间为 3153600秒(365*24*3600)。

    db.msgs.createIndex( { "timestamp ": 1 }, { expireAfterSeconds: 3153600 },{background: true} )

    db.msg_traces.createIndex( { "timestamp ": 1 }, { expireAfterSeconds: 3153600 },{background: true} )

    mongodb TTL索引将每隔60秒对过期数据执行一次删除操作。删除操作的持续实际取决于mongod 实例的负载。

    4 .journal 日志的 commitIntervalMs 参数调整。

    从默认的100ms调大到500ms。

    目前通过读写分离和索引优化之后,原来分片1在业务高峰期间的cpu load 值由最高值250降低到5以内,优化效果非常明显。

    mongodb 分片集群优化思路总结:

    分片集群中出现某个分片负载特别高的情况。(往往是某个分片负载高,如果是多个分片节点负载都高,则需要逐个进行分析)

    第一步:

    首先通过top、iostat、vmstat、mongostat 等工具了解系统大致并发负载和读写比例,观察系统具体瓶颈所在。

    第二步:

    如果负载只是集中出现在某一个节点上,则通过 mongotop 工具先分析该mongodb实例的热点表是哪些并记录下来。

    第三步:

    通过 mlogfilter / mloginfo 工具分析业务高峰期间出现的TOP10 慢查询。

    第四步:

    定位需要优化的目标表,并进行查询优化。

    通常第二步和第三步会出现很多相同的表。因为热点数据表和慢查询表往往存在相同的一些表。这些表就是我们需要优化的目标。

    mongodb 分片表的优化大致从以下几方面着手:

    1.查看表分片键、数据分布、数据总量、数据占用空间等信息。着重看数据分片键设置是否合理、数据分布是否均匀;

    2.mloginfo 工具打印出来的慢查询信息中有每个慢查询的查询条件。确认慢查询表上是否有合适的索引满足查询条件执行。需要结合explain() 分析慢查询的具体执行计划。

    3.选取业务高峰阶段的mongodb实例原始日志,搜索慢查询表相关的原始查询语句。记录这些原始查询语句,方便后续与开发同事沟通,看能否从业务场景上进行相应的优化。

    4.对于日志、事件、会话信息等日志类型的表,可以按照业务需求,根据事件字段,只保留一定时间内的有效数据。通常这要与开发业务

    沟通清楚。确认保留时间后,可以利用mongodb TTL索引特性,在特定时间字段上创建索引,设置记录过期时限。

    第五步:

    架构上做读写分离优化

    如果在第三步找出来的 TOP10 慢查询不少是能有效利用索引的简单查询,正常情况下,执行应该很快(200ms之内)。

    则需要考虑在架构上做读写分离的优化。因为热点表高并发的读写会让cpu 忙不过来,导致原本正常的查询都出现阻塞。

    总之,mongodb 优化关键之处是找出系统瓶颈和问题根源。定位出需要优化的目标表后,简单地加个索引或者做个读写分离,性能问题往往就迎刃而解。

    这个和医生看病颇为相似,通过望闻问切和各种医疗检验设备所反馈的数据和报告,再依据丰富的临床经验诊断出病因所在。找出病因后,开什么方子用什么药就是水到渠成的事了。当然,医生看病比给数据库做性能诊断复杂多了,误诊几率也不小。而且,数据库性能优化没找准原因还有不少试错的机会,但是医生试错成本就比较高了。所以当个好医生貌似比做个好DBA更难!

    以上插了些题外话。优化上过程中,也需要和开发同事保持有效沟通。当我们理解慢查询产生的业务场景后,有时让开发同事配合做个简单的功能优化,头痛的性能问题也能随之解决。



  • 相关阅读:
    网络流24题总结和题解
    NOIP复习之1 数学数论
    BZOJ3301 P2524 UVA11525 算法解释康托展开
    线段树与树状数组的综合运用
    P2261 bzoj1257 [CQOI2007]余数求和
    BZOJ 1968_P1403 [AHOI2005]约数研究--p2260bzoj2956-模积和∑----信息学中的数论分块
    P1064 金明的预算方案
    洛谷p1002 过河卒
    Luogu P3014 [USACO11FEB]牛线Cow Line
    Luogu P3927 SAC E#1
  • 原文地址:https://www.cnblogs.com/duanxz/p/3621155.html
Copyright © 2011-2022 走看看