mangodb
1.安装
sudo apt-get install -y mongodb-org
https://docs.mongodb.com/manual/tutorial/install-mongodb-on-ubuntu/ #官方文档
-
启动命令
-
服务端mongodb的启动
- 查看帮助:mongod –help
- 启动:sudo service mongod start
- 停止:sudo service mongod stop
- 重启:sudo service mongod restart
- 查看是否启动成功:ps -ef|grep mongod
- 配置文件的位置:/etc/mongod.conf,
- 默认端⼝:27017
- 日志的位置:/var/log/mongodb/mongod.log
- 客户端mongo启动
- 启动本地客户端:mongo
- 查看帮助:mongo –help
- 退出:exit或者ctrl+c
-
服务端mongodb无法启动的解决方法
sudo mongod --config /etc/mongod.conf & # & 表示在后台运行
-
mongodb的官方文档
位置:https://docs.mongodb.com/manual/introduction/
- mongodb数据库的命令
- 查看当前的数据库:db
- 查看所有的数据库:show dbs /show databases
- 新建数据库:use 新建的dbname , 如果不插入数据,show dbs并不会显示,插入数据之后就会显示了
- 切换数据库:use db_name
- 删除当前的数据库:use 要删除的数据库 --> db.dropDatabase() 删除当前所在的数据库
- mongodb集合的命令
- 不手动创建集合: 向不存在的集合中第⼀次加⼊数据时, 集合会被创建出来
- 手动创建结合:
- db.createCollection(name,options)
- db.createCollection("stu")
- db.createCollection("sub", { capped : true, size : 10 } )
- 参数capped: 默认值为false表示不设置上限,值为true表示设置上限
- 参数size: 当capped值为true时, 需要指定此参数, 表示上限⼤⼩,当⽂档达到上限时, 会将之前的数据覆盖, 单位为字节
- 查看集合:show collections
- 删除集合:db.集合名称.drop()
- mongodb中常见的数据类型
5.1 常见类型
- Object ID: ⽂档ID
- String: 字符串, 最常⽤, 必须是有效的UTF-8
- Boolean: 存储⼀个布尔值, true或false
- Integer: 整数可以是32位或64位, 这取决于服务器
- Double: 存储浮点值
- Arrays: 数组或列表, 多个值存储到⼀个键
- Object: ⽤于嵌⼊式的⽂档, 即⼀个值为⼀个⽂档
- Null: 存储Null值
- Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数
- Date: 存储当前⽇期或时间的UNIX时间格式
5.2 注意点
- 创建⽇期语句如下 :参数的格式为YYYY-MM-DD new Date('2017-12-20')
- 每个⽂档都有⼀个属性, 为_id, 保证每个⽂档的唯⼀性
可以⾃⼰去设置id插⼊⽂档,如果没有提供, 那么MongoDB为每个⽂档提供了⼀个独特的id, 类型为objectID - objectID是⼀个12字节的⼗六进制数,每个字节两位,一共是24 位的字符串: 前4个字节为当前时间戳 接下来3个字节的机器ID 接下来的2个字节中MongoDB的服务进程id 最后3个字节是简单的增量值
- mongodb的增删改查
mongodb的增删改查的简单流程
- 插入
- insert() 插入数据,_id相同会报错
- save() _id相同会更新
- 删除
- db.collection.remove({条件},{justOne:flase}) #全部删除满足条件的数据
- 更新
- db.collection.update({条件},{$set:{name:10086}},{multi:true})
1 mongodb的插入
- db.集合名称.insert(document)
db.stu.insert({name:'gj',gender:1})
db.stu.insert({_id:"20170101",name:'gj',gender:1})
插⼊⽂档时, 如果不指定_id参数, MongoDB会为⽂档分配⼀个唯⼀的ObjectId
2 mongodb的保存
命令:db.集合名称.save(document) 如果⽂档的id已经存在则修改, 如果⽂档的id不存在则添加
3 mongodb的简单查询
命令:db.集合名称.find()
4 mongodb的更新
命令:db.集合名称.update(
-
参数query:查询条件
-
参数update:更新操作符
-
参数multi:可选, 默认是false,表示只更新找到的第⼀条记录, 值为true表示把满⾜条件的⽂档全部更新
db.stu.update({name:'hr'},{name:'mnc'}) 覆盖更新
db.stu.update({name:'hr'},{(set:{name:'hys'}}) 更新一条 db.stu.update({},{)set:{gender:0}},{multi:true}) 更新全部
注意:"multi update only works with $ operators"
5 mongodb的删除集合里的数据
命令:db.集合名称.remove(
- 参数query:必选,删除的⽂档的条件
- 参数justOne:可选, 如果设为true或1, 则只删除⼀条, 默认false, 表示删除多条
- mongodb的高级查询
1 数据查询
- ⽅法find(): 查询
db.集合名称.find({条件⽂档}) - ⽅法findOne():查询,只返回第⼀个
db.集合名称.findOne({条件⽂档}) - ⽅法pretty(): 将结果格式化
db.集合名称.find({条件⽂档}).pretty()
2 比较运算符
可以使用以下数据进行练习,插入多条数据可以把多条数据放在一个列表里面,即可一次插入
{"name" : "郭靖", "hometown" : "蒙古", "age" : 20, "gender" : true }
{"name" : "⻩蓉", "hometown" : "桃花岛", "age" : 18, "gender" : false }
{"name" : "华筝", "hometown" : "蒙古", "age" : 18, "gender" : false }
{"name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }
{"name" : "段誉", "hometown" : "⼤理", "age" : 16, "gender" : true }
{"name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true }
{"name" : "洪七公", "hometown" : "华⼭", "age" : 18, "gender" : true }
- 等于: 默认是等于判断, 没有运算符
- ⼩于:$lt (less than)
- ⼩于等于:$lte (less than equal)
- ⼤于:$gt (greater than)
- ⼤于等于:$gte
- 不等于:(ne 例如: 查询年龄大于18的所有学生 db.stu.find({age:{)gte:18}})
3 逻辑运算符
逻辑运算符主要指与、或逻辑
-
and:在json中写多个条件即可
查询年龄⼤于或等于18, 并且性别为true的学⽣
db.stu.find({age:{$gte:18},gender:true}) -
or:使⽤(or, 值为数组, 数组中每个元素为json 查询年龄⼤于18, 或性别为false的学⽣ db.stu.find({)or:[{age:{$gt:18}},{gender:false}]})
查询年龄⼤于18或性别为男⽣, 并且姓名是郭靖 db.stu.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'})
4 范围运算符
使⽤$in, $nin 判断数据是否在某个数组内
查询年龄为18、 28的学⽣
db.stu.find({age:{$in:[18,28,38]}})
5 ⽀持正则表达式
使⽤//或$regex编写正则表达式
查询sku以abc开头的数据
db.products.find({sku:/^abc/})
查询sku以789结尾的数据
db.products.find({sku:{$regex:'789$'}})
{ "_id" : 100, "sku" : "abc123", "description" : "Single line description." }
{ "_id" : 101, "sku" : "abc789", "description" : "First line
Second line" }
{ "_id" : 102, "sku" : "xyz456", "description" : "Many spaces before line" }
{ "_id" : 103, "sku" : "xyz789", "description" : "Multiple
line description" }
6 skip和limit
-
⽅法limit(): ⽤于读取指定数量的⽂档
db.集合名称.find().limit(NUMBER)db.stu.find().limit(2) #查询前2条学⽣信息
-
⽅法skip(): ⽤于跳过指定数量的⽂档
db.集合名称.find().skip(NUMBER)
db.stu.find().skip(2) #跳过前2条学⽣信息 -
同时使用 , 先skip再limit效率比较高
db.stu.find().limit(4).skip(5)
或
db.stu.find().skip(5).limit(4) #建议使用此种,效率比较高
注意:先使用skip在使用limit的效率要高于前者
7 自定义查询*了解
由于mongo的shell是一个js的执行环境 使⽤$where后⾯写⼀个函数, 返回满⾜条件的数据
查询年龄⼤于30的学⽣
db.stu.find({
$where:function() {
return this.age>30;}
})
8 投影
在查询到的返回结果中, 只选择必要的字段
命令:db.集合名称.find({},{字段名称:1,...}) #前面的{}放筛选条件,后面的{}放需要显示的字段
参数为字段与值, 值为1表示显示, 值为0不显 特别注意: 对于_id列默认是显示的, 如果不显示需要明确设置-id=0
db.stu.find({},{_id:0,name:1,gender:1})
9 排序
⽅法sort(), ⽤于对 集进⾏排序
命令:db.集合名称.find().sort({字段:1,...})
参数1为升序排列 参数-1为降序排列
根据性别降序, 再根据年龄升序
db.stu.find().sort({gender:-1,age:1})
10 统计个数
⽅法count()⽤于统计结果集中⽂档条数
命令:db.集合名称.find({条件}).count() 命令:db.集合名称.count({条件})
db.stu.find({gender:true}).count()
db.stu.count({age:{$gt:20},gender:true})
db.stu.count() 同级所有
11 消除重复
⽅法distinct()对数据进⾏去重
命令:db.集合名称.distinct('去重字段',{条件})
db.stu.distinct('hometown',{age:{$gt:18}})
mongodb的聚合操作
- mongodb的聚合是什么
聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。
语法:db.集合名称.aggregate({管道:{表达式}})
- mongodb的常用管道和表达式
2.1 常用管道命令
在mongodb中,⽂档处理完毕后, 通过管道进⾏下⼀次处理 常用管道命令如下:
- $group: 将集合中的⽂档分组, 可⽤于统计结果
- $match: 过滤数据, 只输出符合条件的⽂档
- $project: 修改输⼊⽂档的结构, 如重命名、 增加、 删除字段、 创建计算结果
- $sort: 将输⼊⽂档排序后输出
- $limit: 限制聚合管道返回的⽂档数
- $skip: 跳过指定数量的⽂档, 并返回余下的⽂档
2.2 常用表达式
表达式:处理输⼊⽂档并输出 语法:表达式:'$列名' 常⽤表达式:
- (sum: 计算总和, {)sum:1} 表示以⼀倍计数 ,{(sum:")age"}表示计算age的总和
- $avg: 计算平均值
- $min: 获取最⼩值
- $max: 获取最⼤值
- $push: 在结果⽂档中插⼊值到⼀个数组中
- 管道命令之$group
3.1 按照某个字段进行分组
$group是所有聚合命令中用的最多的一个命令,用来将集合中的文档分组,可用于统计结果
使用示例如下
db.stu.aggregate(
{$group:
{
_id:"$gender",
counter:{$sum:1}
}
}
)
其中注意点:
- db.db_name.aggregate是语法,所有的管道命令都需要写在其中
- _id 表示分组的依据,按照哪个字段进行分组,需要使用$gender表示选择这个字段进行分组
- $sum:1 表示把每条数据作为1进行统计,统计的是该分组下面数据的条数
3.2 group by null
当我们需要统计整个文档的时候,$group 的另一种用途就是把整个文档分为一组进行统计
使用实例如下:
db.stu.aggregate(
{$group:
{
_id:null,
counter:{$sum:1}
}
}
)
其中注意点:
- _id:null 表示不指定分组的字段,即统计整个文档,此时获取的counter表示整个文档的个数
3.3 数据透视
正常情况在统计的不同性别的数据的时候,需要知道所有的name,需要逐条观察,如果通过某种方式把所有的name放到一起,那么此时就可以理解为数据透视
使用示例如下:
- 统计不同性别的学生
db.stu.aggregate(
{(group: { _id:null, name:{)push:"$name"}
}
}
) - 使用$$ROOT可以将整个文档放入数组中
db.stu.aggregate(
{(group: { _id:null, name:{)push:"$$ROOT"}
}
}
)
3.4 动手
对于如下数据,需要统计出每个country/province下的userid的数量(同一个userid只统计一次)
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
参考答案
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}}
4.管道命令之$match
(match用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find区别在于)match 操作可以把结果交给下一个管道处理,而find不行
使用示例如下:
-
查询年龄大于20的学生
db.stu.aggregate(
{(match:{age:{)gt:20}}
)
{ "_id" : ObjectId("5c416f8fea98ce04531787f0"), "name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }
{ "_id" : ObjectId("5c416f8fea98ce04531787f2"), "name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true } -
查询年龄大于20的男女学生的人数
db.stu.aggregate(
{(match:{age:{)gt:20}}
{(group:{_id:")gender",counter:{$sum:1}}}
) -
管道命令之$project
$project用于修改文档的输入输出结构,例如重命名,增加,删除字段
使用示例如下:
- 查询学生的年龄、姓名,仅输出年龄姓名
db.stu.aggregate(
{$project:{_id:0,name:1,age:1}}
) - 查询男女生人生,输出人数
db.stu.aggregate(
{(group:{_id:")gender",counter:{(sum:1}}} {)project:{_id:0,counter:1}}
)
5.1 动手练习
对于如下数据:统计出每个country/province下的userid的数量(同一个userid只统计一次),结果中的字段为{country:"",province:"",counter:"*"}
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
参考答案
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}},
{$project:{_id:0,country:'$_id.country',province:'$_id.province',counter:'$count'}}
)
- 管道命令之$sort
$sort用于将输入的文档排序后输出
使用示例如下:
-
查询学生信息,按照年龄 升序( 1
db.stu.aggregate({$sort:{age:1}}) -
查询男女人数,按照人数 降序( -1
db.stu.aggregate(
{(group:{_id:")gender",counter:{(sum:1}}}, {)sort:{counter:-1}}
) -
管道命令之$skip 和 $limit
- $limit限制返回数据的条数
- $skip 跳过指定的文档数,并返回剩下的文档数
- 同时使用时先使用skip在使用limit 执行效率比较高
使用示例如下:
- 查询2条学生信息
db.stu.aggregate(
{$limit:2}
) - 查询从第三条开始的学生信息
db.stu.aggregate(
{$skip:3}
) - 统计男女生人数,按照人数升序,返回第二条数据
db.stu.aggregate(
{(group:{_id:")gender",counter:{(sum:1}}}, {)sort:{counter:-1}},
{(skip:1}, {)limit:1}
)
索引备份和python交互
- mongodb的索引
1.1 为什么mongdb需要创建索引
- 加快查询速度
- 进行数据的去重
1.2 mongodb创建简单的索引方法
- 语法:
- db.集合.ensureIndex({属性:1}),1表示升序, -1表示降序
- db.集合.createIndex({属性:1})
- 上面两个命令效果等价
- 具体操作:db.db_name.ensureIndex({name:1})
1.3 创建索引前后查询速度对比
测试:插入10万条数据到数据库中 插入数据:
for(i=0;i<100000;i++){db.t255.insert({name:'test'+i,age:i})}
创建索引前:
db.t1.find({name:'test10000'})
db.t1.find({name:'test10000'}).explain('executionStats')
创建索引后:
db.t255.ensureIndex({name:1}) //升序以name创建唯一索引,创建时不能有两个相同的name值
db.t1.find({name:'test10000'}).explain('executionStats')
1.4 索引的查看
默认情况下_id是集合的索引
查看方式:db.collection_name.getIndexes()
添加索引前:
> db.test2000.insert({"name":"hello",age:20})
WriteResult({ "nInserted" : 1 })
> db.test2000.find()
{ "_id" : ObjectId("5ae0232f625b9ddd91a0e7ae"), "name" : "hello", "age" : 20 }
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
}
]
添加name为索引后:
> db.test2000.ensureIndex({name:1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
}
]
1.5 mongodb创建唯一索引
在默认情况下mongdb的索引字段的值是可以相同的,仅仅能够提高查询速度
添加唯一索引的语法:
db.collection_name.ensureIndex({"name":1},{"unique":true})
使用普通索引的效果如下:
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
}
]
> db.test2000.insert({name:"hello",age:40})
WriteResult({ "nInserted" : 1 })
> db.test2000.find()
{ "_id" : ObjectId("5ae0232f625b9ddd91a0e7ae"), "name" : "hello", "age" : 20 }
{ "_id" : ObjectId("5ae02421625b9ddd91a0e7af"), "name" : "hello", "age" : 30 }
{ "_id" : ObjectId("5ae02432625b9ddd91a0e7b0"), "name" : "hello", "age" : 40 }
添加age为唯一索引之后:
> db.test2000.createIndex({age:1},{unique:true})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 2,
"numIndexesAfter" : 3,
"ok" : 1
}
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"unique" : true,
"key" : {
"age" : 1
},
"name" : "age_1",
"ns" : "test2000.test2000"
}
]
> db.test2000.insert({"name":"world",age:20})
WriteResult({
"nInserted" : 0,
"writeError" : {
"code" : 11000,
"errmsg" : "E11000 duplicate key error collection: test2000.test2000 index: age_1 dup key: { : 20.0 }"
}
})
1.6 删除索引
语法:db.t1.dropIndex({'索引名称':1})
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"unique" : true,
"key" : {
"age" : 1
},
"name" : "age_1",
"ns" : "test2000.test2000"
}
]
> db.test2000.dropIndex({age:1})
{ "nIndexesWas" : 3, "ok" : 1 }
> db.test2000.dropIndex({name:1})
{ "nIndexesWas" : 2, "ok" : 1 }
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
}
]
1.6 建立复合索引
在进行数据去重的时候,可能用一个字段来保证数据的唯一性,这个时候可以考虑建立复合索引来实现。
例如:抓全贴吧信息,如果把帖子的名字作为唯一索引对数据进行去重是不可取的,因为可能有很多帖子名字相同
建立复合索引的语法:db.collection_name.ensureIndex({字段1:1,字段2:1})
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
}
]
> db.test2000.createIndex({name:1,age:1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1,
"age" : 1
},
"name" : "name_1_age_1",
"ns" : "test2000.test2000"
}
]
1.7 建立索引注意点
- 根据需要选择是否需要建立唯一索引
- 索引字段是升序还是降序在单个索引的情况下不影响查询效率,但是带复合索引的条件下会有影响
例如:在进行查询的时候如果字段1需要升序的方式排序输出,字段2需要降序的方式排序输出,那么此时复合索引的建立需要把字段1设置为1,字段2设置为-1
- mongodb的备份和恢复
2.1 备份
备份的语法:
mongodump -h dbhost -d dbname -o dbdirectory
- -h: 服务器地址, 也可以指定端⼝号
- -d: 需要备份的数据库名称
- -o: 备份的数据存放位置, 此⽬录中存放着备份出来的数据
示例:mongodump -h 192.168.196.128:27017 -d test1 -o ~/Desktop/test1bak
2.2 恢复
恢复语法:mongorestore -h dbhost -d dbname --dir dbdirectory
- -h: 服务器地址
- -d: 需要恢复的数据库实例
- --dir: 备份数据所在位置
示例:mongorestore -h 192.168.196.128:27017 -d test2 --dir ~/Desktop/test1bak/test1
mongodb和python交互
-
mongdb和python交互的模块
pymongo
提供了mongdb和python交互的所有方法 安装方式:
pip install pymongo -
使用pymongo
-
导入pymongo并选择要操作的集合 数据库和集合乜有会自动创建
from pymongo import MongoClient
client = MongoClient(host,port) #实例化连接的客户端
collection = client[db名][集合名] #创建数据库的collections的连接 -
添加一条数据
ret = collection.insert_one({"name":"test10010","age":33})
print(ret) -
添加多条数据
item_list = [{"name":"test1000{}".format(i)} for i in range(10)]
#insert_many接收一个列表,列表中为所有需要插入的字典
t = collection.insert_many(item_list) -
查找一条数据
#find_one查找并且返回一个结果,接收一个字典形式的条件
t = collection.find_one({"name":"test10005"})
print(t) -
查找全部数据
结果是一个Cursor游标对象,是一个可迭代对象,可以类似读文件的指针,但是只能够进行一次读取
#find返回所有满足条件的结果,如果条件为空,则返回数据库的所有
t = collection.find({"name":"test10005"})
#结果是一个Cursor游标对象,是一个可迭代对象,可以类似读文件的指针,
for i in t:
print(i)
for i in t: #此时t中没有内容,这是游标的特殊属性
print(i) -
更新一条数据 注意使用(set 命令 #update_one更新一条数据 collection.update_one({"name":"test10005"},{")set":{"name":"new_test10005"}})
-
更新全部数据, 注意使用(set 命令 # update_one更新全部数据 collection.update_many({"name":"test10005"},{")set":{"name":"new_test10005"}})
-
删除一条数据
#delete_one删除一条数据
collection.delete_one({"name":"test10010"}) -
删除全部数据
#delete_may删除所有满足条件的数据
collection.delete_many({"name":"test10010"})
代码练习
>db.hero.aggregate({$group:{_id:"$hometown",count:{$sum:1}}})
{ "_id" : "华⼭", "count" : 1 }
{ "_id" : "⼤理", "count" : 2 }
{ "_id" : "桃花岛", "count" : 2 }
{ "_id" : "蒙古", "count" : 2 }
> db.hero.aggregate({$group:{_id:"$hometown",count:{$sum:1},total_age:{$sum:"$age"}}})
{ "_id" : "华⼭", "count" : 1, "total_age" : 18 }
{ "_id" : "⼤理", "count" : 2, "total_age" : 61 }
{ "_id" : "桃花岛", "count" : 2, "total_age" : 58 }
{ "_id" : "蒙古", "count" : 2, "total_age" : 38 }
{(sum:1} 与 {)sum:"$age"}的区别
> db.hero.aggregate({$group:{_id:"$hometown",count:{$sum:1},total_age:{$sum:"$age"},avg_age:{$avg:"$age"}}})
{ "_id" : "华⼭", "count" : 1, "total_age" : 18, "avg_age" : 18 }
{ "_id" : "⼤理", "count" : 2, "total_age" : 61, "avg_age" : 30.5 }
{ "_id" : "桃花岛", "count" : 2, "total_age" : 58, "avg_age" : 29 }
{ "_id" : "蒙古", "count" : 2, "total_age" : 38, "avg_age" : 19 }
> db.hero.aggregate({$group:{_id:null,count:{$sum:1}}})
{ "_id" : null, "count" : 7 }
> db.hero.aggregate({$group:{_id:"$gender",hometown:{$push:"$hometown"}}})
{ "_id" : false, "hometown" : [ "桃花岛", "蒙古" ] }
{ "_id" : true, "hometown" : [ "蒙古", "桃花岛", "⼤理", "⼤理", "华⼭" ] }
> db.hero.aggregate({$group:{_id:"$gender",hometown:{$push:"$hometown"},name:{$push:"$name"}}})
{ "_id" : false, "hometown" : [ "桃花岛", "蒙古" ], "name" : [ "⻩蓉", "华筝" ] }
{ "_id" : true, "hometown" : [ "蒙古", "桃花岛", "⼤理", "⼤理", "华⼭" ], "name" : [ "郭靖", "⻩药师", "段誉", "段王爷", "洪七公" ] }
> db.hero.aggregate({$group:{_id:"$gender",name:{$push:"$$ROOT"}}})
{ "_id" : false, "name" : [ { "_id" : ObjectId("5c416f8fea98ce04531787ee"), "name" : "⻩蓉", "hometown" : "桃花岛", "age" : 18, "gender" : false }, { "_id" : ObjectId("5c416f8fea98ce04531787ef"), "name" : "华筝", "hometown" : "蒙古", "age" : 18, "gender" : false } ] }
{ "_id" : true, "name" : [ { "_id" : ObjectId("5c416f8fea98ce04531787ed"), "name" : "郭靖", "hometown" : "蒙古", "age" : 20, "gender" : true }, { "_id" : ObjectId("5c416f8fea98ce04531787f0"), "name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }, { "_id" : ObjectId("5c416f8fea98ce04531787f1"), "name" : "段誉", "hometown" : "⼤理", "age" : 16, "gender" : true }, { "_id" : ObjectId("5c416f8fea98ce04531787f2"), "name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true }, { "_id" : ObjectId("5c416f8fea98ce04531787f3"), "name" : "洪七公", "hometown" : "华⼭", "age" : 18, "gender" : true } ] }
> db.hero.aggregate({$group:{_id:{hometown:"$hometown",gender:"$gender"},count:{$sum:1}}})
{ "_id" : { "hometown" : "华⼭", "gender" : true }, "count" : 1 }
{ "_id" : { "hometown" : "蒙古", "gender" : true }, "count" : 1 }
{ "_id" : { "hometown" : "桃花岛", "gender" : false }, "count" : 1 }
{ "_id" : { "hometown" : "⼤理", "gender" : true }, "count" : 2 }
{ "_id" : { "hometown" : "蒙古", "gender" : false }, "count" : 1 }
{ "_id" : { "hometown" : "桃花岛", "gender" : true }, "count" : 1 }
插入多条数据把字典放入列表中
db.land.insert([{ "country" : "china", "province" : "sh", "userid" : "a" },{ "country" : "china", "province" : "sh", "userid" : "b" },{ "country" : "china", "province" : "sh", "userid" : "a" },{ "country" : "china", "province" : "sh", "userid" : "c" },{ "country" : "china", "province" : "bj", "userid" : "da" },{ "country" : "china", "province" : "bj", "userid" : "fa" }])
> db.land.aggregate({$group:{_id:{country:"$country",province:"$province",userid:"$userid"}}})
{ "_id" : { "country" : "china", "province" : "sh", "userid" : "a" } }
{ "_id" : { "country" : "china", "province" : "sh", "userid" : "c" } }
{ "_id" : { "country" : "china", "province" : "sh", "userid" : "b" } }
{ "_id" : { "country" : "china", "province" : "bj", "userid" : "fa" } }
{ "_id" : { "country" : "china", "province" : "bj", "userid" : "da" } }
> db.land.aggregate({$group:{_id:{country:"$country",province:"$province",userid:"$userid"}}},{$group:{_id:{country:"$_id.country",province:"$_id.province"},count:{$sum:1}}})
{ "_id" : { "country" : "china", "province" : "bj" }, "count" : 2 }
{ "_id" : { "country" : "china", "province" : "sh" }, "count" : 3 }
> db.hero.aggregate({$match:{age:{$gt:18}}},{$group:{_id:"$gender",count:{$sum:1}}})
{ "_id" : true, "count" : 3 }
> db.hero.aggregate({$group:{_id:"$hometown",count:{$sum:1}}},{$project:{_id:0,count:1,hometown:"$_id"}})
{ "count" : 1, "hometown" : "华⼭" }
{ "count" : 2, "hometown" : "⼤理" }
{ "count" : 2, "hometown" : "桃花岛" }
{ "count" : 2, "hometown" : "蒙古" }
> db.hero.aggregate({$group:{_id:"$hometown",count:{$sum:1}}},{$project:{_id:0,sum:"$count",hometown:"$_id"}})
----------打印结果同上,只是把count重命名为sum