1、数据如下,获取每个用户最近的一次登录数据
思路1:order by + group by
先根据UserId+LogInTime排序,再利用Group分组,即可得到每个User_Id的最新数据。
SELECT * FROM login_db l ORDER BY l.user_id, l.login_time DESC;
排序结果:
再对结果进行分组:
SELECT * FROM ( SELECT * FROM login_db l ORDER BY l.user_id, l.login_time DESC ) lb GROUP BY lb.user_id;
得到的结果如下:
从结果可知,这并不是我们预期的结果。因MySql版本的原因,对Group By进行了优化,导致前面的排序不再生效,而是保留了排序前的结果。
为了使Group By根据我们排序后的结果进行分组,需要加入关键字Limit告诉MySql需要进行排序。
修改之后的语句如下:
SELECT * FROM ( SELECT * FROM login_db l ORDER BY l.user_id, l.login_time DESC LIMIT 100000 ) lb GROUP BY lb.user_id;
得到了预期的结果:
从SQL中,不难看出,这个方法存在一个缺陷,就是必须要保证原始数据在limit范围内,否则分组的结果就不会是全部的数据,结果自然也是不能保证的。
思路2:多表关联
利用多表关联,同一纬度(User_Id)下的登录时间进行比较,得出最近的时间。
select b1.* from login_db b1 where (select COUNT(1) from login_db b2 where b2.user_id = b1.user_id and b1.login_time <= b2.login_time) <= 1;