本文链接:https://www.cnblogs.com/tujia/p/13717931.html
一、背景
事情是这样的:需求要求按月的时间维度统计商品的被咨询情况,但咨询量需要按天去重的,即一个会员一天内向客服小姐姐放了N次商品链接,商品咨询量只能算一次
二、未去重的情况
第一次做的时候,是按月的维度,直接统计商品的被咨询次数
SELECT msg_month, goods_code, COUNT(*) AS send_count FROM im_single_msg_detail WHERE msg_month BETWEEN 202007 AND 202009 GROUP BY msg_month, goods_code ORDER BY msg_month ASC, send_count DESC LIMIT 0, 10
后来产品说不太符合他们的要求,发现有一些用户一天会给客服发送10几20次商品链接,这样不去重的统计被咨询次数就没有什么意义不了,不方便他们做商品被咨询排行和咨询转化率(转化为订单的概率)
三、利用 concat 来拼接唯一键,再用 count distinct 来统计咨询量
要求:同一天内同一用户向客服发送同一个商品的链接,不管发送几次都只算一次咨询量
也就是说:concat(msg_date,member_code,goods_code) 一样的时候,不管出现几次都只算一次,即:distinct concat(msg_date,member_code,goods_code)
SELECT msg_month, goods_code, COUNT( DISTINCT CONCAT( msg_date, member_code, goods_code ) ) AS send_count FROM im_single_msg_detail WHERE msg_month BETWEEN 202007 AND 202009 GROUP BY msg_month, goods_code ORDER BY msg_month ASC, send_count DESC LIMIT 0, 10
注:一直都不知道还用 distinct concat 这种用法,今天发现这个,还蛮神奇的~
本文链接:https://www.cnblogs.com/tujia/p/13717931.html
完。