zoukankan      html  css  js  c++  java
  • MongoDB的一些高级语法

     

     

    MongoDB的一些高级语法

    在前面的博客中,我们了解一些Mongodb中最基础的用法,只介绍了简单的增删查改,在这篇博客中,我将介绍一下稍微复杂一点的语法。

    AND 和 OR操作

    AND操作

    在前面的博客中,我们介绍了查找命令,其中可以指令多个查询条件,当所有条件都符合时,就可以查询到数据。那么,如果我们只想只要有一个条件符合,就返回想要的数据,那么我们应该怎么做呢?

    db.getCollection('test_data_1').find({"字段1":"固定值1","字段2":"固定值2"})

    在上面的命令中,实际上是一个隐式的AND,因为需要同时满足。但是又没有出现AND这个关键词,所以被称为“隐式AND操作”。下面,就让我们来将隐式转为显式,只需要使用“$and”即可。

    db.getCollection('test_data_1').find(
        {
        	"$and":[
            	{"字段1":"固定值1"},
            	{"字段2":"固定值2"}
        	]
        }
    )

    OR操作

    or操作就是为了查询只符合其中任一条件的数据。命令语法和显式的AND操作一样。

    db.getCollection('test_data_1').find(
        {
        	"$or":[
            	{"字段1":"固定值1"},
            	{"字段2":"固定值2"}
        	]
        }
    )

    其中,我们需要知道,尽管存在隐式的AND操作,但是,对于OR操作来说,不存在隐式的OR操作。 同时or操作时会遵循一个"短路原则":只要前面的条件满足了,那后面的条件直接跳过(类似编程中的||)。

    嵌入式文档

    下面便是一个嵌入式文档的例子:

    我们可以看到在studyInfo中,还有着score和project。其中,studyInfo被称为嵌入式文档,studyInfo下面的字段被称为嵌套字段

     


     

    插入

    下面是一个插入语句的示例。

    db.getCollection('test_data_1').insertOne(
    {
        "age":18,
        "adress":"Hunan",
        "studyInfo":{
            "score":59,
            "project":"LOL"
            }
        }
    )

    查询

    查询语句

    如果我们需要根据嵌入式文档中的嵌套字段的条件去查询,那么下面这样使用就行了。如果嵌套字段里面还有嵌入式文档,一路点点点过去就行了。

    db.getCollection('test_data_1').find(
        {
        	"studyInfo.score":59
        },
        
        // 不返回studyInfo.score
        {
        	"studyInfo.score":0
        }
    )

    数组(Array)字段

    插入

    在下面中,like字段保存的就是一个数组,所以我们使用**[]**将"apple","orange","fruit"括起来。

    db.getCollection('test_data_1').insertOne(
    {
        "name":"Array",
        "like":["apple","orange","fruit"]
    }
    )	

    使用Robo3T可视化工具查看,显示如下:

     

    1566638722008
    1566638722008

    查询

    其中,like的类型为Array。但是如果我们查询的时候需要根据like中某个值作为筛选目标的时候,我们怎么办呢?我们无需进行其他任何操作(和以前的查询一模一样)。例如查询所有喜欢orange的人:

    db.getCollection('test_data_1').find({"like":"orange"})

    也就是说它的查询与以前没有任何区别。但是,既然是数组,总有一定其他的操作,例如查询字段数组为长度的记录:

    db.getCollection('test_data_1').find({"like":{"$size":3}})

    上面是查询like字段的数组长度为3的记录。

    注意:“$size”只能查询某一个具体长度的数组,而不能查询范围,如果进行范围查询的话,会报错:

     


     

    当然,既然有数组,那么必然会有索引,在mongodb中,数组的第一个元素的索引为0,和大部分的编程的情况是一样的。

    我们可以通过“字段名.索引”来定位元素。例如查询:

    db.getCollection('test_data_1').find(
        {
           "like.0":"apple"
            }
    )

    聚合(Aggregation)

    聚合的功能很简单,就是让Mongodb来处理数据,然后返回被处理好的数据。

    聚合的操作命令是“aggregation”,基本格式是:

    db.getCollection('test_data_1').aggregation([阶段1,阶段2,阶段3……])

    集中,阶段可以为零个(那么就相当于findi命令),也可以为任意数量。其中,阶段中间有点类似linux或者unix中的管道

     

    img
    img

    也就是说,前面一个阶段的输出,是后面一个结点的输入。

    下面是来自菜鸟教程的一些关键字的用法。

    • $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
    • $match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
    • $limit:用来限制MongoDB聚合管道返回的文档数。
    • $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
    • $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
    • $group:将集合中的文档分组,可用于统计结果。
    • $sort:将输入文档排序后输出。
    • $geoNear:输出接近某一地理位置的有序文档。

    下面我将在一些数据的处理方面来介绍一下其中的一些命令。

    筛选数据

    筛选数据的功能乍一看和find的功能差不多,然后仔细一看,还真的和find的功能一模一样。筛选数据的关键字是“ $match”

    db.getCollection('test_data_1').aggregate([{"$match":{和find完全一样的过滤表达式}}])

    下面是返回like字段数组的第一个元素为“apple”的记录(和上面数组字段里面查询返回的结果一模一样)。

    db.getCollection('test_data_1').aggregate([{"$match":{"like.0":"apple"}}])

    那么,这样做有什么意义呢?返回的结果和find的命令一样,还比find麻烦,这样做岂不是多此一举。的确,如果我们仅仅这样做,还不如使用find,它的强大之处在于与其他关键字进行组合。因为进行数据处理,一般第一步都是进行筛选。

    修改字段

    前面我们介绍了$project的介绍,那么修改字段我们将使用$projecto来操作。

    $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。

    正如上面所介绍的,$project的功能很强大,可以做到很多事情。

    1. 修改返回的字段

      下面返回的字段中不包含_id和like 字段

      db.getCollection('test_data_1').aggregate([
          {"$project":{"_id":0,"like":0}}
      ])

      下面是结合$match的使用,其中前面的$match的返回的输出是$project的输入

      db.getCollection('test_data_1').aggregate([
          {"$match":{"like":{"$size":3}}},
          {"$project":{"_id":0,"like":0}}
      ])

      这个的作用也和find中的返回返回部分字段的操作差不多,这个操作没有什么让人新奇的地方,下面将介绍它的其他强大之处。

      注意事项

      包括现有字段

      • _id 字段默认包含在输出文档中。
      • 如果指定包含文档中不存在的字段, $project 将忽略该字段包含,并且不会将该字段添加到文档中。

      取消_id字段

      • 默认情况下, _id 字段包含在输出文档中。要从输出文档中排除 _id 字段,必须在 $project 中明确指定对 _id 字段的抑制。

      排除字段

      • 如果指定排除某个或多个字段,则在输出文档中返回所有其他字段。

      • 如果指定排除 _id 以外的字段,则不能使用任何其他 $project 规范表单:即,如果排除字段,则不能指定包含字段,重置现有字段的值或添加新字段。

    2. 添加新的字段

      如果我想返回的结果中添加新的字段,怎么办?在project中直接添加就行

      db.getCollection('test_data_1').aggregate([
         
          {"$project":{
              "name":1,
              "_id":0,
         		// 添加的新的字段
              "add":"GG"
              }
           }
      ])

      不过值得注意的是:

      如果指定排除 _id 以外的字段,则不能使用任何其他 $project 规范表单:即,如果排除字段,则不能指定包含字段,重置现有字段的值或添加新字段。

      也就是说,如果排除了除“_id”以外的字段,那么,就GG了。就没办法添加字段了。

       


       

      并且值得注意的是,添加新的字段的时候,如果旧的字段不设置为1,则不会返回。(也就是说,如果添加了新的字段,想要返回本来存在字段,必须将字段设置为1)

       


       
    3. 重命名字段

      重命名字段和添加新的字段差不多,简单点来说,我们可以使用“$旧的字段名”来表示字段的数据。示例如下

      db.getCollection('test_data_1').aggregate([
         
          {"$project":{
          	// 添加新的字段,新的字段的数据是name字段的数据
              "add":"$name"
              }
           }
      ])

      结果如下:

       


       

      这个对于嵌套文档有着非常好的效果,可以看下面的两个例子

      使用find使用聚合

       

       
    4. 处理特殊字符

      这里有说两个问题,如果我需要修改一个字段的数据为1,或者为$project呢?可以知道,这些值与mongodbe自身的语法冲突了(所有以“$”开头的普通字符串和数字都不能添加)。这个时候我们可以使用" $literal"关键字。

       


       

    分组操作

    分组操作所对应的关键字是“$group”,它的作用是根据给出的字段key,它所有的key的值相同的记录放在一起进行运算。

    去重

    在上一篇博客中使用了去重函数“distinct”,使用该函数后,返回的是一个数组。不过,现在我们可以使用“$group”去重。操作如下所示:

    db.getCollection('test_data_1').aggregate(
        [
            {
                "$group":{"_id":"$被g去重的字段名"}
            }
        ]
    )

    其中,“_id”是必不可少的,不能用其他的去替代。而这个返回的也不是一个数组,而是很多条记录。

     


     

    分组操作运算

    首先先说一下运算的关键字,关键字包括(来自菜鸟教程):

    表达式描述实例
    $sum 计算总和。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
    $avg 计算平均值 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
    $min 获取集合中所有文档对应值得最小值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
    $max 获取集合中所有文档对应值得最大值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
    $push 在结果文档中插入值到一个数组中。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
    $addToSet 在结果文档中插入值到一个数组中,但不创建副本。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
    $first 根据资源文档的排序获取第一个文档数据。 db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
    $last 根据资源文档的排序获取最后一个文档数据 db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

    大家看那个实例估计也明白怎么操作了。首先我们先去重,然后再指定名字,最后进行计算:

    计算的方法:{$关键字:$已有的字段名}

    下面便是计算age的平均值,然后以“aver_age”返回。

     


     

    原则上,“$sum”和“$avg”的值对应的值应该是数字,如果使用非数字,则“$sum”会返回0,“$avg”会返回“null”。注意,字符串是可以比较大小的。其中,“$sum”的值还可以使用数字“1”,例如"count":{"$sum":1},则返回的就是每个分组有多少条记录。

    拆分数组

    拆分数组使用的关键字是“$unwind”,它的作用是把一条包含数组的记录拆分为很对条记录,其中,每一条记录拥有数组中的一个元素。

    下面是数组like和infos进行拆分,其中拆分的结果数量是like数组的长度乘以infos数组的长度。

    db.getCollection('test_data_1').aggregate(
        [
            {"$unwind":"$like"},
            {"$unwind":"$infos"},
        ]
    )

     


     

    联集合查询

    Mongodb中的联集合查询类似SQL中的联表查询,在联集合查询中,有两个概念,主集合被查集合。简单点来说,就是主集合提供字段key,然后被查集合通过字段key查出需要的字段。

    db.getCollection('主集合名').aggregate([
        "$lookup":{
                "from":"被查集合名",
                "localField":"主集合提供的字段key",
                "foreginField":"被查集合接受的字段",
                "as":"为查出来的字段命名",
        }
    ]
    )

    下面是两个文档,一个为user,一个为login

    现在我们通过login中的id从user中拿出字段:

    db.getCollection('login').aggregate([
       { "$lookup":{
                "from":"user",
                "localField":"loginId",
                "foreignField":"id",
                "as":"login_name",
            }
       }
    ]
    )

    返回结果如下:

     


     

    其中,login_name为联结合查出来的数据,为一个数组。

    当然,对于这个结果的样式我们是不太满意的,因为我我们只想拿出name,这个时候我们就需要使用前面的知识来解决这个问题了。

    db.getCollection('login').aggregate([
       { "$lookup":{
                "from":"user",
                "localField":"loginId",
                "foreignField":"id",
                "as":"login_name",
            }
       },   {
           "$unwind":"$login_name"
       },
       {
           "$project":{
               "_id":0,
               "loginId":1,
               "name":"$login_name.name"
               
               }
       }
    ])

    返回的结果如图所示:

     


     

    参考资料

    参考书籍:《左手Mongodb,右手Redis》

    菜鸟教程:https://www.runoob.com/mongodb/mongodb-tutorial.html

    docs4dev:https://www.docs4dev.com/docs/zh/mongodb/v3.6/reference

  • 相关阅读:
    查找第一个不重复的字符问题
    gops
    关于 Go 中 Map 类型和 Slice 类型的传递
    Go 程序的性能优化及 pprof 的使用
    Go语言标准库_输入/输出
    Linux 终端 Bash 常用快捷键介绍及经验
    蓄水池采样算法(Reservoir Sampling)
    Guice 依赖绑定
    基本动态规划之硬币问题
    程序打包成jar 获取不到工程目录下文件的问题
  • 原文地址:https://www.cnblogs.com/xiaohuiduan/p/11409050.html
Copyright © 2011-2022 走看看