一.mysql版本
5.7.18-log
二.表结构
表结构很简单,我删除了业务相关字段,只有两个字段,一个是自增长id,一个是类型。
CREATE TABLE `table1` ( `id` bigint(20) NOT NULL AUTO_INCREMENT PRIMARY key, `type` varchar(20) NOT NULL )
三.问题背景
我需要的是每天执行一个任务,每种类型保留n条数据,超过n条数据的按照插入时间(因为id是自增长,所以也可以按照id大小)删除,少于n条数据的不处理。
四.思路
因为要分组删除,所以首先肯定是根据类型group by,然后每组的要删除的记录不一样,要找到那个可以删除的条件,可以通过再次关联table1,找到刚好有n个同类型的id大于自身id的,作为临界点,插入临时表,然后再删除。
代码如下:其中limit_count为要保留的数据数量
BEGIN CREATE TEMPORARY TABLE IF NOT EXISTS tmp_table ( type VARCHAR(50) NOT NULL, min_id int not NULL ); insert into tmp_table (type,min_id) select a.type,a.id from table1 a join table1 b on a.type=b.type and a.id < b.id GROUP BY a.type,a.id having count(*)=limit_count; delete a FROM table1 a join tmp_table t on a.type=t.type where a.id <= t.min_id; drop TABLE tmp_table; END
五.探讨
在执行存储过程的时候,会在插入临时表的时候触发mysql 1055错误,错误如下: [Err] 1055 - Expression #1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column 'information_schema.PROFILING.SEQ' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by,虽然不会影响结果,数据仍旧删除。但是我查过资料,only_full_group_by是指在严格模式下分组过程中,select的字段未在group by或者聚合函数中,但是我检查了我的sql脚本,并不符合这个条件,有没有知道的朋友可以解个惑?如果有朋友有更优化的写法,也可以说一下。