zoukankan      html  css  js  c++  java
  • 分析函数和开窗函数

    分析函数
      分析函数是Oracle专门用于解决复杂报表统计需求的功能强大的函数,它可以在数据中进行分组然后计算基于组的某种统计值,并且每一组的每一行都可以返回一个统计值

    分析函数和聚合函数的区别
      普通的聚合函数用group by分组,每个分组返回一个统计值
      分析函数采用partition by分组,并且每组每行都可以返回一个统计值

      显而易见的区别是,从返回结果上看:
      聚合后的记录数可能会减少,因为它对数据源进行了group by操作,所以对结果是有影响的,即返回的结果里去掉聚合的列后,跟聚合前的结果不一样
      而分析后的记录数是不变的,因为它的作用仅仅在于分析,所以不会对结果有影响,即返回的结果里去掉分析的列后,跟分析前的结果是一样的

    分析函数的形式
      分析函数要与开窗函数(over())一起使用,使用形式为:分析函数() over()

    开窗函数(over())

      开窗函数(over())包含三个分析子句:
        分组子句(partition by)
        排序子句(order by)
        窗口子句(rows)

      开窗函数(over())使用形式如下:
        over(partition by xxx order by yyy rows between zzz)

      开窗函数里的"",即"窗口",表示分析函数分析时要处理的数据范围
      比如分析函数sum(),它所针对的数据范围为窗口中的记录,而不是整个表的记录
      要获取某个范围的sum值,则需在窗口指定具体的数据范围
      比如指定该窗口从该分组中的第一行到最后一行,那么该组中的每一个sum值都会一样,即整个组的总和

      窗口子句除了rows方式的窗口,还包括range方式和滑动窗口


      排序子句(order by)

        排序子句的使用方法跟sql中的order by一样,如:order by colA desc, colB asc nulls first, colC  nulls last
        开窗函数的order bysql语句的order by的执行时机
          分析及开窗函数是在整个sql查询结束后再进行的, sql语句的order by也会影响分析函数的执行结果,有以下两种情况:
            1) 两者一致,即sql语句中的order by语句与开窗函数的order by一致,则sql语句中的order by先执行,分析函数在分析时就不必再排序
            2) 两者不一致,即sql语句中的order by语句与开窗函数的order by不一致,则分析及开窗函数先分析排序,sql语句中的order by再最后执行

      窗口子句(rows)
        如果没有窗口子句(rows),则默认当前组的第一行到当前行

        无论是否省略分组子句,都有:
          窗口子句(rows)不能单独存在,必须有order by子句时才能出现
          相反,有order by子句,可以没有窗口子句(rows)

        当省略窗口子句时
          如果存在order by,则默认的窗口是unbounded preceding and current row,即当前组的第一行到当前行
          如果不存在order by,则默认的窗口是unbounded preceding and unbounded following,即整个组

        例如:lag(sal) over(order by sal)
        over(order by salary)表示意义如下:
          1) 由于省略分组子句,所以当前组的范围为整个表的数据行
          2) 在当前组(此时为整个表的数据行)这个范围里执行排序,即order by salary
          3) 分析函数lag(sal)在当前组(此时为整个表的数据行)这个范围里的窗口范围为当前组的第一行到当前行,即分析函数lag(sal)在这个窗口范围执行

          

        窗口子句(rows)的相关关键字:
        preceding:表示在...之前
          1 preceding:表示当前记录的前1条记录
          2 preceding:表示当前记录的前2条记录
          n preceding:表示当前记录的前n条记录
          unbounded preceding:不受控制的,无限的,
                       若无分组,则表示所有记录的第1条记录
                       若有分组,则表示分组后,组内的第1条记录

        following:表示在...之后
          1 following:表示当前记录的后一条记录
          2 following:表示当前记录的后两条记录
          n following:表示当前记录的后n条记录
          unbounded following:不受控制的,无限的,
                    若无分组,则表示所有记录的最后一条记录
                    若有分组,则表示分组后,组内的最后一条记录

        相关用例:
          rows between unbounded preceding and unbounded following:针对所有记录
          rows between unbounded preceding and current row:针对第一条记录到当前记录
          rows between current row and unbounded following:针对当前记录到最后一条记录
          rows between 1 preceding and current row:针对当前记录的上一行记录到当前行记录
          rows between current row and 3 following:针对当前记录到当前行记录的后三条记录
          rows between 1 preceding and 2 following:针对当前记录的上一条记录 ~~ 当前行记录的后两条记录

        当开窗函数over()出现分组(partition by)子句时
          unbounded preceding即表中一个分组里的第一行,unbounded following即表中一个分组里的最后一行
        当开窗函数over()省略了分组(partition by)子句时
          unbounded preceding即表中的第一行, unbounded following即表中的最后一行


        使用示例:

    select t.id,
           t.name,
           t.city,
           t.sales,
           --按城市分组,且组内销量升序排列,并获取当前记录针对上一条记录到下一条记录范围内的最小销量值
           min(t.sales) over(partition by t.city order by t.sales rows between 1 preceding and 1 following) as col1,
           --按城市分组,且组内销量升序排列,并获取当前记录针对第一条记录到当前记录范围内的最小销量值
           min(t.sales) over(partition by t.city order by t.sales rows between unbounded preceding and current row) as col2,
           --按城市分组,且组内销量升序排列,并获取当前记录针对上三条记录到当前记录范围内的最小销量值
           min(t.sales) over(partition by t.city order by t.sales rows between 3 preceding and current row) as col3
    from dataset t
    
    

       

  • 相关阅读:
    [笔记] 什么是欠采样?
    [笔记] Frequncy Divider
    [笔记] SDRAM读写控制
    能力去激活
    一个实用的SQL
    有用的SQL 语句(不断更新)
    javascript 与服务器端交互的一个小问题
    Javascript 验证码
    几个文本编辑器
    ASP.NET验证码(3种)
  • 原文地址:https://www.cnblogs.com/shiliye/p/12363300.html
Copyright © 2011-2022 走看看