zoukankan      html  css  js  c++  java
  • 查看每份数据的记录数,确认数据平均分布

    mysql> select case when created_time >= '2017-01-01' 
        ->              and created_time < '2017-01-02 10:43:20'
        ->             then '2017-01-01'(http://www.amjmh.com/v/BIBRGZ_558768/)
        ->             when created_time >= '2017-01-02 10:43:20'
        ->              and created_time < '2017-01-03 21:26:40'
        ->             then '2017-01-02 10:43:20'
        ->             when created_time >= '2017-01-03 21:26:40' 
        ->              and created_time < '2017-01-05 08:10:00'
        ->             then '2017-01-03 21:26:40' 
        ->             else '2017-01-05 08:10:00'
        ->         end min_dt,
        ->        case when created_time >= '2017-01-01' 
        ->              and created_time < '2017-01-02 10:43:20'
        ->             then '2017-01-02 10:43:20'
        ->             when created_time >= '2017-01-02 10:43:20'
        ->              and created_time < '2017-01-03 21:26:40'
        ->             then '2017-01-03 21:26:40'
        ->             when created_time >= '2017-01-03 21:26:40' 
        ->              and created_time < '2017-01-05 08:10:00'
        ->             then '2017-01-05 08:10:00'
        ->             else '2017-01-06 18:53:20'
        ->         end max_dt,
        ->        count(*)
        ->   from t_source
        ->  group by case when created_time >= '2017-01-01' 
        ->              and created_time < '2017-01-02 10:43:20'
        ->             then '2017-01-01'
        ->             when created_time >= '2017-01-02 10:43:20'
        ->              and created_time < '2017-01-03 21:26:40'
        ->             then '2017-01-02 10:43:20'
        ->             when created_time >= '2017-01-03 21:26:40' 
        ->              and created_time < '2017-01-05 08:10:00'
        ->             then '2017-01-03 21:26:40' 
        ->             else '2017-01-05 08:10:00'
        ->         end,
        ->        case when created_time >= '2017-01-01' 
        ->              and created_time < '2017-01-02 10:43:20'
        ->             then '2017-01-02 10:43:20'
        ->             when created_time >= '2017-01-02 10:43:20'
        ->              and created_time < '2017-01-03 21:26:40'
        ->             then '2017-01-03 21:26:40'
        ->             when created_time >= '2017-01-03 21:26:40' 
        ->              and created_time < '2017-01-05 08:10:00'
        ->             then '2017-01-05 08:10:00'
        ->             else '2017-01-06 18:53:20'
        ->         end;
    +---------------------+---------------------+----------+
    | min_dt              | max_dt              | count(*) |
    +---------------------+---------------------+----------+
    | 2017-01-01          | 2017-01-02 10:43:20 |   249999 |
    | 2017-01-02 10:43:20 | 2017-01-03 21:26:40 |   250000 |
    | 2017-01-03 21:26:40 | 2017-01-05 08:10:00 |   250000 |
    | 2017-01-05 08:10:00 | 2017-01-06 18:53:20 |   250002 |
    +---------------------+---------------------+----------+
    4 rows in set (4.86 sec)
    ---------------------

  • 相关阅读:
    开源包管理系统和环境管理系统 Conda
    浅谈 Python 的模块导入
    用 pytest 测试 python 代码
    关于特征筛选中的IV值
    二 k-means聚类算法的手动实现
    二 统计量及其抽样分布
    PAT B1056组合数的和
    PAT B1061判断题
    'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
    Hadoop搭建高可用的HA集群
  • 原文地址:https://www.cnblogs.com/hyhy904/p/11311227.html
Copyright © 2011-2022 走看看