postgres in查询优化 - 走看看

zoukankan html css js c++ java

postgres in查询优化
项目场景：

从kafka消费N条数据，每条带有一个id，从表A中查出这N个id对应的N条记录，继续做其他业务

翻译：select * from A where id in("1","2","3","4","5",..............)

这里的id是一个字符串，非数值型，N是一个可配的（比如我们一般是2000-4000），表示一次从kafka消费的条数

表A数据量：5000万以内

数据库：postgres 9.6

初期：直接暴力执行select * from A where id in("1","2","3","4","5",..............)查出结果，因为考虑到性能，N只给500-1000条

然而查询很慢，严重影响后续整个的速度

修改一：将N个id的查询改为200个一批查一次，每次的结果拼接后组成N条记录

修改二：将N个id的查询改为200个一批，开10个线程查询，最后结果合并

这样的查询，速度也可以接受，但是总感觉应该还有别的方式处理in操作

于是找到了regexp_split_to_table这个函数：

SELECT * from regexp_split_to_table('111,222,333,444',',') t left JOIN A on A.id = t;

该函数将一个list转化成一张临时表（案列中的in的条件），与将要查询的表做联表查询，左表的量相当于in条件的id个数

项目中大表量最大为8000万，

sql实例：
select f.* from (select regexp_split_to_table(#{picIds},',')as id) as t, dw_face_feature f where t.id = f.human_pic_id
```
有兴趣的伙伴可以放入项目中一试~~
```
查看全文

相关阅读:
深度学习之视频人脸识别系列二：人脸检测与对齐
 终极指南：构建用于检测汽车损坏的Mask R-CNN模型（附Python演练）
数据挖掘和机器学习的面试问题
 SVM多核学习方法简介
 RookeyFrame 线上添加Model
RookeyFrame Bug 线上创建的DLL被删除了模块无法删除临时解决
 RookeyFrame Bug 编号显示系统自动生成的问题，有时候依旧会显示text文本框
 C# 跨域请求带cookie
RookeyFrame 隐藏首次加载菜单的伸缩动画
 RookeyFrame 加载自定义JS

原文地址：https://www.cnblogs.com/yb38156/p/11195727.html

Copyright © 2011-2022 走看看