zoukankan      html  css  js  c++  java
  • 【Mongodb】分片集群

    Mongodb Sharded Cluster 分片集群

    1 分片概念

    分片(sharding)是一种跨多台机器分布数据的方法, MongoDB使用分片来支持具有非常大的数据集和高吞吐量操作的部署。

    2 分片集群包含的组件

    MongoDB分片群集包含以下组件:

    • 分片(存储):每个分片包含分片数据的子集。 每个分片都可以部署为副本集。
    • mongos(路由):mongos充当查询路由器,在客户端应用程序和分片集群之间提供接口。
    • config servers(“调度”的配置):配置服务器存储群集的元数据和配置设置

    3 分片集群实战

    目标搭建两个分片(每个分片分别是副本集),一个配置副本集(包含3个节点),路由 (由两个节点组成)
    准备3个虚拟机:地址分别是
    192.168.40.144, 192.168.40.145, 192.168.40.146

    节点 位置
    分片1 192.168.40.144:27017,192.168.40.144:27018,192.168.40.144:27019
    分片2 192.168.40.145:27017,192.168.40.145:27018,192.168.40.145:27019
    配置 192.168.40.146:27017,192.168.40.146:27018,192.168.40.146:27019
    路由 192.168.40.146:28001,192.168.40.146:28002

    分片搭建

    首先分别在144/145虚拟机上面搭建一个可复制集(分别包含3个节点)
    如:

    systemLog:
      #MongoDB发送所有日志输出的目标指定为文件 
      destination: file
      #mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径 
      path: "/home/amber/mongodb/sharded_cluster/myshardrs01/mongodb-001/log/mongod.log" 
      #当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。 
      logAppend: true
    storage: 
      #mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。 
      dbPath: "/home/amber/mongodb/sharded_cluster/myshardrs01/mongodb-001/data/db" 
      journal:
        #启用或禁用持久性日志以确保数据文件保持有效和可恢复。 
        enabled: true
    processManagement:
      #启用在后台运行mongos或mongod进程的守护进程模式。 
      fork: true 
      #指定用于保存mongos或mongod进程的进程ID的文件位置,其中mongos或mongod将写入其PID 
      pidFilePath: "/home/amber/mongodb/sharded_cluster/myshardrs01/mongodb-001/log/mongod.pid" 
    net:
      # 服务实例绑定所有IP,有副作用,副本集初始化的时候,节点名字会自动设置为本地域名,而不是ip 
      #bindIpAll: true 
      #服务实例绑定的IP 
      bindIp: 0.0.0.0
      #bindIp 
      #绑定的端口 
      port: 27017
    replication: 
      #副本集的名称 
      replSetName: myshardrs01
    sharding: 
      #分片角色 shardsvr/configsvr
      clusterRole: shardsvr
    

    分片配置要重点关注以下配置:

    replication: 
      #副本集的名称 
      replSetName: myshardrs01
    sharding: 
      #分片角色 shardsvr分片/configsvr配置
      clusterRole: shardsvr
    

    配置节点的搭建:

    systemLog:
      #MongoDB发送所有日志输出的目标指定为文件 
      destination: file
      #mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径 
      path: "/home/amber/mongodb/sharded_cluster/myconfigrs/mongodb-002/log/mongod.log" 
      #当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。 
      logAppend: true
    storage: 
      #mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。 
      dbPath: "/home/amber/mongodb/sharded_cluster/myconfigrs/mongodb-002/data/db" 
      journal:
        #启用或禁用持久性日志以确保数据文件保持有效和可恢复。 
        enabled: true
    processManagement:
      #启用在后台运行mongos或mongod进程的守护进程模式。 
      fork: true 
      #指定用于保存mongos或mongod进程的进程ID的文件位置,其中mongos或mongod将写入其PID 
      pidFilePath: "/home/amber/mongodb/sharded_cluster/myconfigrs/mongodb-002/log/mongod.pid" 
    net:
      # 服务实例绑定所有IP,有副作用,副本集初始化的时候,节点名字会自动设置为本地域名,而不是ip 
      #bindIpAll: true 
      #服务实例绑定的IP 
      bindIp: 0.0.0.0
      #bindIp 
      #绑定的端口 
      port: 27018
    replication: 
      #副本集的名称 
      replSetName: myconfigrs
    sharding: 
      #分片角色 shardsvr/configsvr
      clusterRole: configsvr
    

    配置节点的配置其实和分片的配置没有很大的差别,主要是修改了分片角色

    sharding: 
      #分片角色 shardsvr/configsvr
      clusterRole: configsvr
    

    路由节点搭建

    配置

    systemLog:
      #MongoDB发送所有日志输出的目标指定为文件 
      destination: file
      #mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径 
      path: "/home/amber/mongodb/sharded_cluster/myconfigrs/mongodb-001/log/mongod.log" 
      #当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。 
      logAppend: true
    processManagement:
      #启用在后台运行mongos或mongod进程的守护进程模式。 
      fork: true 
      #指定用于保存mongos或mongod进程的进程ID的文件位置,其中mongos或mongod将写入其PID 
      pidFilePath: "/home/amber/mongodb/sharded_cluster/myconfigrs/mongodb-001/log/mongod.pid" 
    net:
      # 服务实例绑定所有IP,有副作用,副本集初始化的时候,节点名字会自动设置为本地域名,而不是ip 
      #bindIpAll: true 
      #服务实例绑定的IP 
      bindIp: 0.0.0.0
      #bindIp 
      #绑定的端口 
      port: 28001
    sharding: 
      configDB: myconfigrs/192.168.40.146:27017,192.168.40.146:27018,192.168.40.146:27219
    

    相对于配置节点和分片节点的配置文件,路由节点的配置文件减少了data存储地址配置。变更了,其中configDB为配置节点的地址

    sharding: 
      configDB: myconfigrs/192.168.40.146:27017,192.168.40.146:27018,192.168.40.146:27219
    

    启动路由节点

    mongods -f ../conf/mongod.conf
    

    客户端登录

    mongo 192.168.40.146:27017
    

    插入数据时候发现报错,原因是虽然节点配置节点已经和路由节点联通了,但是分片节点还没有与路由节点联通

    mongos> use amber
    switched to db amber
    mongos> db.amber.insert({name: "amber"})
    WriteCommandError({
    	"ok" : 0,
    	"errmsg" : "unable to initialize targeter for write op for collection amber.amber :: caused by :: Database amber not found :: caused by :: No shards found",
    	"code" : 70,
    	"codeName" : "ShardNotFound",
    	"operationTime" : Timestamp(1593535804, 2),
    	"$clusterTime" : {
    		"clusterTime" : Timestamp(1593535804, 2),
    		"signature" : {
    			"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
    			"keyId" : NumberLong(0)
    		}
    	}
    })
    
    

    联通分片节点

    mongos> sh.addShard("myshardrs01/192.168.40.144:27017,192.168.40.144:27018,192.168.40.144:27019")
    {
    	"shardAdded" : "myshardrs01",
    	"ok" : 1,
    	"operationTime" : Timestamp(1593536073, 2),
    	"$clusterTime" : {
    		"clusterTime" : Timestamp(1593536073, 2),
    		"signature" : {
    			"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
    			"keyId" : NumberLong(0)
    		}
    	}
    }
    
    mongos> sh.status()
    --- Sharding Status --- 
      sharding version: {
      	"_id" : 1,
      	"minCompatibleVersion" : 5,
      	"currentVersion" : 6,
      	"clusterId" : ObjectId("5efb6ae9d123f9c8ef7b74ed")
      }
      shards:
            {  "_id" : "myshardrs01",  "host" : "myshardrs01/192.168.40.144:27017,192.168.40.144:27018,192.168.40.144:27019",  "state" : 1 }
      active mongoses:
            "4.0.10" : 1
      autosplit:
            Currently enabled: yes
      balancer:
            Currently enabled:  yes
            Currently running:  no
            Failed balancer rounds in last 5 attempts:  0
            Migration Results for the last 24 hours: 
                    No recent migrations
      databases:
            {  "_id" : "config",  "primary" : "config",  "partitioned" : true }
    
    

    同样的把145分片也加上

    mongos> sh.addShard("myshardrs02/192.168.40.145:27017,192.168.40.145:27018,192.168.40.145:27019")
    {
    	"shardAdded" : "myshardrs02",
    	"ok" : 1,
    	"operationTime" : Timestamp(1593536130, 4),
    	"$clusterTime" : {
    		"clusterTime" : Timestamp(1593536130, 4),
    		"signature" : {
    			"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
    			"keyId" : NumberLong(0)
    		}
    	}
    }
    
    mongos> sh.status()
    --- Sharding Status --- 
      sharding version: {
      	"_id" : 1,
      	"minCompatibleVersion" : 5,
      	"currentVersion" : 6,
      	"clusterId" : ObjectId("5efb6ae9d123f9c8ef7b74ed")
      }
      shards:
            {  "_id" : "myshardrs01",  "host" : "myshardrs01/192.168.40.144:27017,192.168.40.144:27018,192.168.40.144:27019",  "state" : 1 }
            {  "_id" : "myshardrs02",  "host" : "myshardrs02/192.168.40.145:27017,192.168.40.145:27018,192.168.40.145:27019",  "state" : 1 }
      active mongoses:
            "4.0.10" : 1
      autosplit:
            Currently enabled: yes
      balancer:
            Currently enabled:  yes
            Currently running:  no
            Failed balancer rounds in last 5 attempts:  0
            Migration Results for the last 24 hours: 
                    No recent migrations
      databases:
            {  "_id" : "config",  "primary" : "config",  "partitioned" : true }
    
    

    再操作数据库,开启分片

    mongos> sh.enableSharding("amber")
    {
    	"ok" : 1,
    	"operationTime" : Timestamp(1593536255, 3),
    	"$clusterTime" : {
    		"clusterTime" : Timestamp(1593536255, 3),
    		"signature" : {
    			"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
    			"keyId" : NumberLong(0)
    		}
    	}
    }
    
    mongos> sh.status()
    --- Sharding Status --- 
      sharding version: {
      	"_id" : 1,
      	"minCompatibleVersion" : 5,
      	"currentVersion" : 6,
      	"clusterId" : ObjectId("5efb6ae9d123f9c8ef7b74ed")
      }
      shards:
            {  "_id" : "myshardrs01",  "host" : "myshardrs01/192.168.40.144:27017,192.168.40.144:27018,192.168.40.144:27019",  "state" : 1 }
            {  "_id" : "myshardrs02",  "host" : "myshardrs02/192.168.40.145:27017,192.168.40.145:27018,192.168.40.145:27019",  "state" : 1 }
      active mongoses:
            "4.0.10" : 1
      autosplit:
            Currently enabled: yes
      balancer:
            Currently enabled:  yes
            Currently running:  no
            Failed balancer rounds in last 5 attempts:  0
            Migration Results for the last 24 hours: 
                    No recent migrations
      databases:
            {  "_id" : "amber",  "primary" : "myshardrs02",  "partitioned" : true,  "version" : {  "uuid" : UUID("f65d89d3-ad59-40ab-9009-bb91fdb8d1d9"),  "lastMod" : 1 } }
            {  "_id" : "config",  "primary" : "config",  "partitioned" : true }
                    config.system.sessions
                            shard key: { "_id" : 1 }
                            unique: false
                            balancing: true
                            chunks:
                                    myshardrs01	1
                            { "_id" : { "$minKey" : 1 } } -->> { "_id" : { "$maxKey" : 1 } } on : myshardrs01 Timestamp(1, 0) 
    
    
    

    对amber数据库的amber集合进行分片,并使用age作为键值以及采用hashed算法定位数据应该存放再哪一个分片中

    mongos> sh.shardCollection("amber.amber",{"age":"hashed"})
    {
    	"ok" : 0,
    	"errmsg" : "Please create an index that starts with the proposed shard key before sharding the collection",
    	"code" : 72,
    	"codeName" : "InvalidOptions",
    	"operationTime" : Timestamp(1593536415, 4),
    	"$clusterTime" : {
    		"clusterTime" : Timestamp(1593536415, 4),
    		"signature" : {
    			"hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
    			"keyId" : NumberLong(0)
    		}
    	}
    }
    

    分片规则一:哈希策略
    对于 基于哈希的分片 ,MongoDB计算一个字段的哈希值,并用这个哈希值来创建数据块.在使用基于哈希分片的系统中,拥有”相近”片键的文档 很可能不会 存储在同一个数据块中,因此数据的分离性更好一些.

     sh.shardCollection("amber.amber",{"age":"hashed"})
    

    分片规则二:范围策略
    对于 基于范围的分片 ,MongoDB按照片键的范围把数据分成不同部分.假设有一个数字的片键:想象一个从负无穷到正无穷的直线,每一个片键的值都在直线上画了一个点.MongoDB把这条直线划分为更短的不重叠的片段,并称之为 数据块 ,每个数据块包含了片键在一定范围内的数据.

     sh.shardCollection("amber.amber",{"age":1})
    
  • 相关阅读:
    thinkphp下载远程图片到本地
    centos6.5安装sublime text 2
    centos6.5安装node.js
    thinkphp分页搜索条件带中文参数
    netbean快捷键
    caffe+NVIDIA安装+CUDA7.5+ubuntu14.04(显卡GTX1080)
    poj 1410 Intersection
    安装openblas和matcaffe时遇到的问题
    ubuntu 14.04 安装matlab2015b(破解版),具体软件请访问我的网盘~
    FasterRCNN编译使用及相应问题解决
  • 原文地址:https://www.cnblogs.com/amberbar/p/13217696.html
Copyright © 2011-2022 走看看