网上有很多教程把Replica Sets和Auto Sharding(或者是Sharding)写在了一起,对于初学者可能会觉得有些莫名,之所以这样做是因为,一个较好的Auto Sharding解决方案是将每个一shard(分片)定为一个Replica Sets(复制集)。一个Replica Sets由若干个mongod instance组成,在这个集合中,所有的instance的数据相同,这使得即使有某一台机子当掉了,其它机子还是可以正常运行,而且这部分的控制是由Mongo自动完成的,因而尽可能地减少了因当机而产生的错误及人工处理的部分。而Sharding是可以将庞大的数据库拆分为几个部分分别发放到每一个shard,一来降低了单一一台服务器的压力,同时通过减少潜在的损失比例来提高效率。也就是说一个基于Replica Sets的Auto Sharding结构,可以把一个完整而且庞大的数据库根据个人定制,拆分到若干个服务器集合,每个服务器集合中的服务器群又相互保持数据同步,所以除非一个服务器集合中的所有服务器都当掉了,否则某台或几台的当机对数据库的影响是微忽其微的。关于这两个部分,其实在Mongo的官方文档里有详细的说明,所以此文是以总结归纳为目的而写。
(图片来源:http://www.mongodb.org/display/DOCS/Sharding+Introduction)
1.一个完整的Auto Sharding功能的实现需要用到mongod和mongos,其中mongos作为真正的应用接口,数据的输入输出都应经过它。然后还需要一个config server,它是mongod,但它不会用来存储应用程序的数据库,通俗的来说而是存放了这整个结构的配置属性,mongos会从config server中读取配置来进行工作。最后是真正会存储数据的mongod们,它们按组分为若干个Replica Sets,用来存放mongos拆分下来的各个sharding。
2.配置推荐从配置各个Replica Sets开始,一个Replica Set包含若干个mongod instance,基础命令是:mongod --replSet %SETNAME% --shardsvr,同属一个Replica Set的instance都使用同一个%SETNAME%,比如一个名为“set1”的Replica Set中有三台服务器,分别名为“server1”,“server2”,“server3”,则在这三台服务器上需要分别运行命令:
server1: mongod --replSet set1 --shardsvr
server2: mongod --replSet set1 --shardsvr
server2: mongod --replSet set1 --shardsvr
启动mongod包含多个参数,这个可以通过命令:mongod --help来查询,根据自己的需求修改,上面的为必要部分。
每个服务器都启动好mongod后,开始进行Replica Sets的初始化,初始化的方法有多种,以下介绍比较方便的两种:
(1)initiate(cfg),其中cfg由用户编写;
(2)initiate->add;
3.然后是启动config serve;
4.最后是启动mongs;
时间有限,具体配置步骤与配图后一篇再做喽:P