zoukankan      html  css  js  c++  java
  • mysql时间序列与窗口函数

    一、datetime 格式数据提取

    mysql 中已存在列格式为 datetime 格式时,提取其中的年:

    季度: quarter
    月:month
    周 :week 
    日:day
    时:hour
    分:minute
    秒:second
    select year(a.`订购日期`) from `订单` a;

    改变显示格式方法:

    1、格式化:
    SELECT DATE_FORMAT(a.`订购日期`,'%Y-%m') from `订单` a;
    
    2、字符串截取
    select left(a.`订购日期`,10) from `订单` a;

    二、mysql中关于date函数

    向日期添加指定时间间隔函数
    date_add(date,INTERVAL expr type)
    
    向日期减去指定时间间隔函数
    date_sub(date,INTERVAL expr type)
    
    返回两个日期之间的函数
    datediff(date1,date2)
    
    以不同的格式显示时间
    date_format(date,format)

    三、查看连续登录天数

    这类问题,用窗口函数来解决更方便些,下面先列举下常用的窗口函数

    1、累计计算窗口函数 
    sum、avg、max、min  
    sum(...A...) over (partition by...B... order by ...C... rows between....D1...and...D2...)
    partition by   分组字段
    order by       按什么字段排序
    rows...between  计算的行数范围   移动求平均值常用
    
    2、分区排序窗口函数
    row_number() over (partition by...B... order by ...C...)     1 2 3 4 5
    rank() over (partition by...B... order by ...C...)           1 1 1 4 5
    dense_rank() over (partition by...B... order by ...C...)     1 1 1 2 3 
    
    3、分组排序  
    ntile() 不支持分组排序 rows ..between ...
    ntile() over (partition by...B... order by ...C...)    前 10%的用户
    
    4、偏移分析窗口函数
    应用场景 :解决今天和昨天的数据差
    前offset 行数据
    lag(exp_str,offset,defval) over (partition by...B... order by ...C...)
    
    后offset 行数据
    lead(exp_str,offset,defval) over (partition by...B... order by ...C...)

    举个例子

    创建表,字段有 id,long_time 
    create table user_login(user_id int,login_time date);
    
    插入数据
    insert into user_login values
    (1,'2019-06-01'),
    (1,'2019-06-02'),
    (1,'2019-06-03'),
    (1,'2019-06-06'),
    (1,'2019-06-07'),
    (1,'2019-06-08'),
    (1,'2019-06-11'),
    (1,'2019-06-12'),
    (2,'2019-06-01'),
    (2,'2019-06-02'),
    (2,'2019-06-04'),
    (3,'2019-06-01'),
    (3,'2019-06-02'),
    (4,'2019-06-01'),
    (5,'2019-06-01'),
    (5,'2019-06-02');

    1、显示出每个用户连续登录天数,不去重用户

    1、对原表增加分区排序窗口函数 row_number,按序号分组,时间排序
    2、用date_sub()函数,登录日期减去序号,如果是连续登录日期,那么date_sub()函数结果就会一致
    3、最后,将数据结果按id 和 date_sub()函数分组
    
    SELECT user_id,
    date_sub(login_time, INTERVAL rn DAY) AS login_group,  -- 连续登录数据会一致
    min(login_time) AS start_login_time,
    max(login_time) AS end_login_time,
    count(login_time) AS continuous_days
    FROM
    (SELECT user_id,login_time,
    row_number () over (PARTITION BY user_id ORDER BY login_time) AS rn    分区排序窗口函数,分组、排序
    FROM 
    user_login) t
    GROUP BY user_id, date_sub(login_time, INTERVAL rn DAY);/2、

    2、计算连续出现n次数据问题

    成绩连续出现三次
    解题思路 :
    1、偏移分析窗口函数,将成绩向上偏移两位
    2、计算score列与偏移后成绩的差值,0值即连续的成绩
    
    SELECT id,score,(score - lead_score) as score3 from
    (select id,score,lead(score,2) over (order by id) as lead_score from score order by id) a
    WHERE  (score - lead_score)=0;

     

  • 相关阅读:
    POJ 3616 Milking Time(简单DP)
    POJ 2954 Triangle(计算几何Pick定理)
    POJ 3664 Election Time(简单的快速排序)
    POJ 2007 Scrambled Polygon(计算几何凸包)
    POJ 3673 Cow Multiplication(简单数学)
    POJ 3663 Costume Party (快速排序)
    计算几何模板(一)
    [转]Silverlight中使用MVVM(3)
    Silverlight中使用MVVM(2)
    Silverlight使用Binding动态绑定数据
  • 原文地址:https://www.cnblogs.com/interdrp/p/13633640.html
Copyright © 2011-2022 走看看