zoukankan      html  css  js  c++  java
  • SQL Server Partition by 和 Group by对比

    参考:https://www.cnblogs.com/hello-yz/p/9962356.html

    ——————————————————

    今天大概弄懂了partition by和group by的区别联系。

    1. group by是分组函数,partition by是分析函数(然后像sum()等是聚合函数);

    2. 在执行顺序上,

    以下是常用sql关键字的优先级

    from > where > group by > having > order by

    而partition by应用在以上关键字之后,实际上就是在执行完select之后,在所得结果集之上进行partition。

    3. partition by相比较于group by,能够在保留全部数据的基础上,只对其中某些字段做分组排序(类似excel中的操作),而group by则只保留参与分组的字段和聚合函数的结果(类似excel中的pivot)。

    partition by

    group by

    4. 如果在partition结果上聚合,千万注意聚合函数是逐条累计运行结果的!而在group by后的结果集上使用聚合函数,会作用在分组下的所有记录上。

    数据如下,

    SQL1

    select a.cc,a.item,sum(a.num)
    from table_temp a
    group by a.cc,a.item

    Result1

    11条记录经group by后为10条,其中cc='cn' and item='8.1.1'对应的两条记录的num汇总成值3.

    SQL2

    复制代码
    select a.cc,a.num, min(a.num) over (partition by a.cc order by a.num asc) as amount
    from table_temp a
    group by a.cc,a.num;
    
    select a.cc,a.num, min(a.num) over (partition by a.cc order by a.num desc) as amount
    from table_temp a
    group by a.cc,a.num;
    复制代码

    Result2

      

    两个sql的唯一区别在于a.num的排序上,但从结果红框中的数据对比可以看到amount值并不相同,且第二个结果集amount并不都是最小值1。

    在这里就是要注意将聚合函数用在partition后的结果集上时,聚合函数是逐条累积计算值的!

    其实partition by常同row_number() over一起使用,

    select a.*, row_number() over (partition by a.cc,a.item order by a.num desc) as seq
    from table_temp a

    清醒时做事,糊涂时读书,大怒时睡觉,独处时思考; 做一个幸福的人,读书,旅行,努力工作,关心身体和心情,成为最好的自己 -- 共勉
  • 相关阅读:
    异常总结201304
    Android开发资料[20121125]
    大素数的生成
    django 获取用户IP地址
    python包管理工具pip
    mysql大表修改结构
    素数的检测
    一致性哈希算法 python实现
    素数的生成筛选法
    相似哈希simhash
  • 原文地址:https://www.cnblogs.com/frankcui/p/10510026.html
Copyright © 2011-2022 走看看