zoukankan      html  css  js  c++  java
  • mongodb基础应用

    一些概念

    一个mongod服务可以有建立多个数据库,每个数据库可以有多张表,这里的表名叫collection,每个collection可以存放多个文档(document),每个文档都以BSON(binary json)的形式存放于硬盘中,因此可以存储比较复杂的数据类型。它是以单文档为单位存储的,你可以任意给一个或一批文档新增或删除字段,而不会对其它文档造成影响,这就是所谓的schema-free,这也是文档型数据库最主要的优点。跟一般的key-value数据库不一样的是,它的value中存储了结构信息,所以你又可以像关系型数据库那样对某些域进行读写、统计等操作。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。Mongo还可以解决海量数据的查询效率,根据官方文档,当数据量达到50GB以上数据时,Mongo数据库访问速度是MySQL10 倍以上。

    BSON

    BSON是BinaryJSON 的简称,是一个JSON文档对象的二进制编码格式。BSON同JSON一样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型。如:BSON有Date类型和BinDate类型。

    BSON被比作二进制的交换格式,如同Protocol Buffers,但BSON比它更“schema-less”,非常好的灵活性但空间占用稍微大一点。

    BSON有以下三个特点:

    1. 轻量级

    2. 跨平台

    3. 效率高

    命名空间

    MongoDB存储BSON对象到collections,这一系列的数据库名和collection名被称为一个命名空间。如同:java.util.List;用来管理数据库中的数据。

    索引

    mongodb可以对某个字段建立索引,可以建立组合索引、唯一索引,也可以删除索引,建立索引就意味着增加空间开销。默认情况下每个表都会有一个唯一索引:_id,如果插入数据时没有指定_id,服务会自动生成一个_id,为了充分利用已有索引,减少空间开销,最好是自己指定一个unique的key为_id,通常用对象的ID比较合适,比如商品的ID。

     

    成功启动MongoDB后,再打开一个命令行窗口输入mongo,就可以进行数据库的一些操作。

    输入help可以看到基本操作命令:

    show dbs:显示数据库列表 show collections:显示当前数据库中的集合(类似关系数据库中的表) show users:显示用户

    use <db name>:切换当前数据库,这和MS-SQL里面的意思一样 db.help():显示数据库操作命令,里面有很多的命令 db.foo.help():显示集合操作命令,同样有很多的命令,foo指的是当前数据库下,一个叫foo的集合,并非真正意义上的命令 db.foo.find():对于当前数据库中的foo集合进行数据查找(由于没有条件,会列出所有数据) db.foo.find( { a : 1 } ):对于当前数据库中的foo集合进行查找,条件是数据中有一个属性叫a,且a的值为1

    MongoDB没有创建数据库的命令,但有类似的命令。

    如:如果你想创建一个“myTest”的数据库,先运行use myTest命令,之后就做一些操作(如:db.createCollection('user'),这样就可以创建一个名叫“myTest”的数据库。

    数据库常用命令

    1Help查看命令提示

    help

    db.help();

    db.yourColl.help();

    db.youColl.find().help();

    rs.help();

    2、切换/创建数据库

    use yourDB; 当创建一个集合(table)的时候会自动创建当前数据库

    3、查询所有数据库

    show dbs;

    4、删除当前使用数据库

    db.dropDatabase();

    5、从指定主机上克隆数据库

    db.cloneDatabase(“127.0.0.1”); 将指定机器上的数据库的数据克隆到当前数据库

    6、从指定的机器上复制指定数据库数据到某个数据库

    db.copyDatabase("mydb", "temp", "127.0.0.1");将本机的mydb的数据复制到temp数据库中

    7、修复当前数据库

    db.repairDatabase();

    8、查看当前使用的数据库

    db.getName();

    db; dbgetName方法是一样的效果,都可以查询当前使用的数据库

    9、显示当前db状态

    db.stats();

    10、当前db版本

    db.version();

    11、查看当前db的链接机器地址

    db.getMongo();

    Collection聚集集合

    1、创建一个聚集集合(table

    db.createCollection(“collName”, {size: 20, capped: 5, max: 100});

    2、得到指定名称的聚集集合(table

    db.getCollection("account");

    3、得到当前db的所有聚集集合

    db.getCollectionNames();

    4、显示当前db所有聚集索引的状态

    db.printCollectionStats();

    用户相关

    1、添加一个用户

    db.addUser("name");

    db.addUser("userName", "pwd123", true); 添加用户、设置密码、是否只读

    2、数据库认证、安全模式

    db.auth("userName", "123123");

    3显示当前所有用户

    show users;

    4、删除用户

    db.removeUser("userName");

    其他

    1、查询之前的错误信息

    db.getPrevError();

    2、清除错误记录

    db.resetError();

    查看聚集集合基本信息

    1、查看帮助  db.yourColl.help();
    2、查询当前集合的数据条数  db.yourColl.count();
    3、查看数据空间大小 db.userInfo.dataSize();
    4、得到当前聚集集合所在的db db.userInfo.getDB();
    5、得到当前聚集的状态 db.userInfo.stats();
    6、得到聚集集合总大小 db.userInfo.totalSize();
    7、聚集集合储存空间大小 db.userInfo.storageSize();
    8、Shard版本信息  db.userInfo.getShardVersion()
    9、聚集集合重命名 db.userInfo.renameCollection("users"); 将userInfo重命名为users
    10、删除当前聚集集合 db.userInfo.drop();

    聚集集合查询

    1、查询所有记录
    db.userInfo.find();
    相当于:select* from userInfo;
    默认每页显示20条记录,当显示不下的情况下,可以用it迭代命令查询下一页数据。注意:键入it命令不能带“;”
    但是你可以设置每页显示数据的大小,用DBQuery.shellBatchSize= 50;这样每页就显示50条记录了。
    
    
    2、查询去掉后的当前聚集集合中的某列的重复数据
    db.userInfo.distinct("name");
    会过滤掉name中的相同数据
    相当于:select distict name from userInfo;
    
    
    3、查询age = 22的记录
    db.userInfo.find({"age": 22});
    相当于: select * from userInfo where age = 22;
    
    
    4、查询age > 22的记录
    db.userInfo.find({age: {$gt: 22}});
    相当于:select * from userInfo where age >22;
    
    
    5、查询age < 22的记录
    db.userInfo.find({age: {$lt: 22}});
    相当于:select * from userInfo where age <22;
    
    
    6、查询age >= 25的记录
    db.userInfo.find({age: {$gte: 25}});
    相当于:select * from userInfo where age >= 25;
    
    
    7、查询age <= 25的记录
    db.userInfo.find({age: {$lte: 25}});
    
    
    8、查询age >= 23 并且 age <= 26
    db.userInfo.find({age: {$gte: 23, $lte: 26}});
    
    
    9、查询name中包含 mongo的数据
    db.userInfo.find({name: /mongo/});
    //相当于%%
    select * from userInfo where name like ‘%mongo%’;
    
    
    10、查询name中以mongo开头的
    db.userInfo.find({name: /^mongo/});
    select * from userInfo where name like ‘mongo%’;
    
    
    11、查询指定列name、age数据
    db.userInfo.find({}, {name: 1, age: 1});
    相当于:select name, age from userInfo;
    当然name也可以用true或false,当用ture的情况下河name:1效果一样,如果用false就是排除name,显示name以外的列信息。
    
    
    12、查询指定列name、age数据, age > 25
    db.userInfo.find({age: {$gt: 25}}, {name: 1, age: 1});
    相当于:select name, age from userInfo where age >25;
    
    
    13、按照年龄排序
    升序:db.userInfo.find().sort({age: 1});
    降序:db.userInfo.find().sort({age: -1});
    
    
    14、查询name = zhangsan, age = 22的数据
    db.userInfo.find({name: 'zhangsan', age: 22});
    相当于:select * from userInfo where name = ‘zhangsan’ and age = ‘22’;
    
    
    15、查询前5条数据
    db.userInfo.find().limit(5);
    相当于:selecttop 5 * from userInfo;
    
    
    16、查询10条以后的数据
    db.userInfo.find().skip(10);
    相当于:select * from userInfo where id not in (
    selecttop 10 * from userInfo
    );
    
    
    17、查询在5-10之间的数据
    db.Login.find({},{"loginName":1}).limit(5);
    可用于分页,limit是pageSize,skip是第几页*pageSize
    
    
    18、or与 查询
    db.userInfo.find({$or: [{age: 22}, {age: 25}]});
    相当于:select * from userInfo where age = 22 or age = 25;
    
    
    19、查询第一条数据
    db.userInfo.findOne();
    相当于:selecttop 1 * from userInfo;
    db.userInfo.find().limit(1);
    
    
    20、查询某个结果集的记录条数
    db.userInfo.find({age: {$gte: 25}}).count();
    相当于:select count(*) from userInfo where age >= 20;
    
    
    21、按照某列进行排序
    db.userInfo.find({sex: {$exists: true}}).count();
    相当于:select count(sex) from userInfo;

    索引

    1、创建索引
    db.userInfo.ensureIndex({name: 1});
    db.userInfo.ensureIndex({name: 1, ts: -1});
    
    
    2、查询当前聚集集合所有索引
    db.userInfo.getIndexes();
    
    
    3、查看总索引记录大小
    db.userInfo.totalIndexSize();
    
    
    4、读取当前集合的所有index信息
    db.users.reIndex();
    
    
    5、删除指定索引
    db.users.dropIndex("name_1");
    
    
    6、删除所有索引索引
    db.users.dropIndexes();

    修改、添加、删除集合数据

    1、添加
    db.users.save({name: ‘zhangsan’, age: 25, sex: true});
    添加的数据的数据列,没有固定,根据添加的数据为准
    
    
    2、修改
    db.users.update({age: 25}, {$set: {name: 'changeName'}}, false, true);
    相当于:update users set name = ‘changeName’ where age = 25;
    
    
    db.users.update({name: 'Lisi'}, {$inc: {age: 50}}, false, true);
    相当于:update users set age = age + 50 where name = ‘Lisi’;
    
    
    db.users.update({name: 'Lisi'}, {$inc: {age: 50}, $set: {name: 'hoho'}}, false, true);
    相当于:update users set age = age + 50, name = ‘hoho’ where name = ‘Lisi’;
    
    
    3、删除
    db.users.remove({age: 132});
    
    
    4、查询修改删除
    db.users.findAndModify({
        query: {age: {$gte: 25}}, 
        sort: {age: -1}, 
        update: {$set: {name: 'a2'}, $inc: {age: 2}},
        remove: true
    });
    
    
    db.runCommand({ findandmodify : "users", 
        query: {age: {$gte: 25}}, 
        sort: {age: -1}, 
        update: {$set: {name: 'a2'}, $inc: {age: 2}},
        remove: true
    });

    updateremove其中一个是必须的参数; 其他参数可选。

    参数

    详解

    默认值

    query

    查询过滤条件

    {}

    sort

    如果多个文档符合查询过滤条件,将以该参数指定的排列方式选择出排在首位的对象,该对象将被操作

    {}

    remove

    若为true,被选中对象将在返回前被删除

    N/A

    update

    一个修改器对象

    N/A

    new

    若为true,将返回修改后的对象而不是原始对象。在删除操作中,该参数被忽略。

    false

    fields

    参见Retrieving  a Subset of Fields (1.5.0+)

    All fields

    upsert

    创建新对象若查询结果为空。示例  (1.5.4+)

    false

    语句块操作

    1、简单Hello World
    print("Hello World!");
    这种写法调用了print函数,和直接写入"Hello World!"的效果是一样的;
    
    
    2、将一个对象转换成json
    tojson(new Object());
    tojson(new Object('a'));
    
    
    3、循环添加数据
    > for (vari= 0;i<30;i++) {
    ... db.users.save({name: "u_" + i, age: 22 + i, sex: i % 2});
    ... };
    这样就循环添加了30条数据,同样也可以省略括号的写法
    > for (vari= 0;i<30;i++) db.users.save({name: "u_" + i, age: 22 + i, sex: i % 2});
    也是可以的,当你用db.users.find()查询的时候,显示多条数据而无法一页显示的情况下,可以用it查看下一页的信息;
    
    
    4、find 游标查询
    >varcursor = db.users.find();
    > while (cursor.hasNext()) { 
        printjson(cursor.next()); 
    }
    这样就查询所有的users信息,同样可以这样写
    varcursor = db.users.find();
    while (cursor.hasNext()) { printjson(cursor.next); }
    同样可以省略{}号
    
    
    5、forEach迭代循环
    db.users.find().forEach(printjson);
    forEach中必须传递一个函数来处理每条迭代的数据信息
    
    
    6、将find游标当数组处理
    varcursor = db.users.find();
    cursor[4];
    取得下标索引为4的那条数据
    既然可以当做数组处理,那么就可以获得它的长度:cursor.length();或者cursor.count();
    那样我们也可以用循环显示数据
    for (vari = 0, len = c.length(); i<len;i++) printjson(c[i]);
    
    
    7、将find游标转换成数组
    >var arr = db.users.find().toArray();
    > printjson(arr[2]);
    用toArray方法将其转换为数组
    
    
    8、定制我们自己的查询结果
    只显示age <= 28的并且只显示age这列数据
    db.users.find({age: {$lte: 28}}, {age: 1}).forEach(printjson);
    db.users.find({age: {$lte: 28}}, {age: true}).forEach(printjson);
    排除age的列
    db.users.find({age: {$lte: 28}}, {age: false}).forEach(printjson);
    
    
    9、forEach传递函数显示信息
    db.things.find({x:4}).forEach(function(x) {print(tojson(x));});

    shell操作数据库:

    1. 超级用户相关:

    1. #进入数据库admin

    use admin

    2. #增加或修改用户密码

    db.addUser('name','pwd')

    3. #查看用户列表

    db.system.users.find()

    4. #用户认证

    db.auth('name','pwd')

    5. #删除用户

    db.removeUser('name')

    6. #查看所有用户

    show users

    7. #查看所有数据库

    show dbs

    8. #查看所有的collection

    show collections

    9. #查看各collection的状态

    db.printCollectionStats()

    10. #查看主从复制状态

    db.printReplicationInfo()

    11. #修复数据库

    db.repairDatabase()

    12. #设置记录profiling,0=off 1=slow 2=all

    db.setProfilingLevel(1)

    13. #查看profiling

    show profile

    14. #拷贝数据库

    db.copyDatabase('mail_addr','mail_addr_tmp')

    15. #删除collection

    db.mail_addr.drop()

    16. #删除当前的数据库

    db.dropDatabase()

    2. 增删改

    1. #存储嵌套的对象

    db.foo.save({'name':'ysz','address':{'city':'beijing','post':100096},'phone':[138,139]})

    2. #存储数组对象

    db.user_addr.save({'Uid':'yushunzhi@sohu.com','Al':['test-1@sohu.com','test-2@sohu.com']})

    3. #根据query条件修改,如果不存在则插入,允许修改多条记录

    db.foo.update({'yy':5},{'$set':{'xx':2}},upsert=true,multi=true)

    4. #删除yy=5的记录

    db.foo.remove({'yy':5})

    5. #删除所有的记录

    db.foo.remove()

    3. 索引

    1. #增加索引:1(ascending),-1(descending)

    2. db.foo.ensureIndex({firstname:1, lastname: 1}, {unique: true});

    3. #索引子对象

    4.db.user_addr.ensureIndex({'Al.Em': 1})

    5. #查看索引信息

    6. db.foo.getIndexes()

    7. db.foo.getIndexKeys()

    8. #根据索引名删除索引

    9.db.user_addr.dropIndex('Al.Em_1')

    4. 查询

    1. #查找所有

    2. db.foo.find()

    3. #查找一条记录

    4. db.foo.findOne()

    5. #根据条件检索10条记录

    6.db.foo.find({'msg':'Hello 1'}).limit(10)

    7. #sort排序

    8.db.deliver_status.find({'From':'ixigua@sina.com'}).sort({'Dt',-1})

    9.db.deliver_status.find().sort({'Ct':-1}).limit(1)

    10. #count操作

    11. db.user_addr.count()

    12. #distinct操作,查询指定列,去重复

    13. db.foo.distinct('msg')

    14. #”>=”操作

    15.db.foo.find({"timestamp": {"$gte" : 2}})

    16. #子对象的查找

    17.db.foo.find({'address.city':'beijing'})

    5. 管理

    1. #查看collection数据的大小

    2.db.deliver_status.dataSize()

    3. #查看colleciont状态

    4.db.deliver_status.stats()

    5. #查询所有索引的大小

    6.db.deliver_status.totalIndexSize()

    5. advanced queries:高级查询

    条件操作符 $gt : > $lt : < $gte: >= $lte: <= $ne : !=、<> $in : in $nin: not in $all: all $not: 反匹配(1.3.3及以上版本)
    查询 name <> "bruce" and age >= 18 的数据 db.users.find({name: {$ne: "bruce"}, age: {$gte: 18}});
    查询 creation_date > '2010-01-01' and creation_date<= '2010-12-31' 的数据 db.users.find({creation_date:{$gt:new Date(2010,0,1), $lte:newDate(2010,11,31)});
    查询 age in (20,22,24,26) 的数据 db.users.find({age: {$in: [20,22,24,26]}});
    查询 age取模10等于0 的数据 db.users.find('this.age % 10 == 0'); 或者 db.users.find({age : {$mod : [10, 0]}});
    匹配所有 db.users.find({favorite_number : {$all : [6, 8]}}); 可以查询出{name: 'David', age: 26, favorite_number: [ 6, 8,9 ] } 可以不查询出{name: 'David', age: 26, favorite_number: [ 6, 7,9 ] }
    查询不匹配name=B*带头的记录 db.users.find({name: {$not: /^B.*/}}); 查询 age取模10不等于0 的数据 db.users.find({age : {$not: {$mod : [10, 0]}}});
    #返回部分字段 选择返回age和_id字段(_id字段总是会被返回) db.users.find({}, {age:1}); db.users.find({}, {age:3}); db.users.find({}, {age:true}); db.users.find({ name : "bruce" }, {age:1}); 0为false, 非0为true
    选择返回age、address和_id字段 db.users.find({ name : "bruce" }, {age:1, address:1});
    排除返回age、address和_id字段 db.users.find({}, {age:0, address:false}); db.users.find({ name : "bruce" }, {age:0, address:false});
    数组元素个数判断 对于{name: 'David', age: 26, favorite_number: [ 6, 7, 9 ]}记录 匹配db.users.find({favorite_number: {$size: 3}}); 不匹配db.users.find({favorite_number: {$size: 2}});
    $exists判断字段是否存在 查询所有存在name字段的记录 db.users.find({name: {$exists: true}}); 查询所有不存在phone字段的记录 db.users.find({phone: {$exists: false}});
    $type判断字段类型 查询所有name字段是字符类型的 db.users.find({name: {$type: 2}}); 查询所有age字段是整型的 db.users.find({age: {$type: 16}});
    对于字符字段,可以使用正则表达式 查询以字母b或者B带头的所有记录 db.users.find({name: /^b.*/i});
    $elemMatch(1.3.1及以上版本) 为数组的字段中匹配其中某个元素
    Javascript查询和$where查询 查询 age > 18 的记录,以下查询都一样 db.users.find({age: {$gt: 18}}); db.users.find({$where: "this.age > 18"}); db.users.find("this.age > 18"); f = function() {return this.age > 18} db.users.find(f);
    排序sort() 以年龄升序asc db.users.find().sort({age: 1}); 以年龄降序desc db.users.find().sort({age: -1});
    限制返回记录数量limit() 返回5条记录 db.users.find().limit(5); 返回3条记录并打印信息 db.users.find().limit(3).forEach(function(user) {print('my age is ' +user.age)}); 结果 my age is 18 my age is 19 my age is 20
    限制返回记录的开始点skip() 从第3条记录开始,返回5条记录(limit 3, 5) db.users.find().skip(3).limit(5);
    查询记录条数count() db.users.find().count(); db.users.find({age:18}).count(); 以下返回的不是5,而是user表中所有的记录数量 db.users.find().skip(10).limit(5).count(); 如果要返回限制之后的记录数量,要使用count(true)或者count(非0) db.users.find().skip(10).limit(5).count(true);
    分组group() 假设test表只有以下一条数据 { domain: "www.mongodb.org" , invoked_at: {d:"2009-11-03", t:"17:14:05"} , response_time: 0.05 , http_action: "GET /display/DOCS/Aggregation" } 使用group统计test表11月份的数据count:count(*)、total_time:sum(response_time)、avg_time:total_time/count; db.test.group( { cond: {"invoked_at.d": {$gt: "2009-11", $lt:"2009-12"}} , key: {http_action: true} , initial: {count: 0, total_time:0} , reduce: function(doc, out){ out.count++; out.total_time+=doc.response_time } , finalize: function(out){ out.avg_time = out.total_time / out.count } } );
    [ { "http_action" : "GET /display/DOCS/Aggregation", "count" : 1, "total_time" : 0.05, "avg_time" : 0.05 } ]

     

  • 相关阅读:
    Ubuntu apt-get "Hash Sum mismatch" 问题解决方法
    模型压缩相关工作
    bn两个参数的计算以及layer norm、instance norm、group norm
    cascade rcnn论文总结
    c++ 堆和栈以及区别
    c++ 浅拷贝和深拷贝 指针和引用的区别 malloc(free)和new(delete)的区别 重载重写重定义
    c++ 多态,虚函数、重载函数、模版函数
    c++问题整理
    repulsion-loss
    smooth l1
  • 原文地址:https://www.cnblogs.com/andashu/p/6406879.html
Copyright © 2011-2022 走看看