zoukankan      html  css  js  c++  java
  • SQL的技巧

    衍生特征时, 统计每个类目id的用户的购买次数、金额, 用了下面语法, 发现效率很低.

    select UID
    , sum(if(item_level1_id='1', order_cnt, 0)) sum_cnt_level1_id_1
    , sum(if(item_level1_id='2', order_cnt, 0)) sum_cnt_level1_id_2
    ...
    from TABLE
    group by UID
    

    更改, 先用聚合的concat把结果存在一个字符串中, 在从字符串中取出字段值, 效率大为提升.
    猜测原理是, 多个聚合函数导致重复计算. 改为一个稍微复杂的函数, 仍然很快. 时间从2小时变为20分钟.

    select UID
    , sum(if(item_level1_id='1', order_cnt, 0)) sum_cnt_level1_id_1
    , sum(if(item_level1_id='2', order_cnt, 0)) sum_cnt_level1_id_2
    ...
    from TABLE
    group by UID
    
  • 相关阅读:
    我的第一篇博客
    文献笔记5
    文献笔记4
    文献笔记8
    文献笔记6
    文献笔记10
    文献笔记7
    文献笔记1
    文献笔记2
    文献笔记3
  • 原文地址:https://www.cnblogs.com/bregman/p/10424411.html
Copyright © 2011-2022 走看看