zoukankan      html  css  js  c++  java
  • 一次利用位图索引进行SQL优化的案例

    最近用户报告某操作极为耗时,经查,是取一个较复杂的视图的记录数引起的,相应select语句及视图定义类似于:

    select count(*) from my_view;
    
    create or replace my_view
    as select
      tab1.ID, tab1.f1, tab1.f2,
      tab2.f3, tab2.f4,
      tab3.f5, tab3.f6
    from tab1
    left join tab2 on tab1.ID=tab2.ID
    left join tab3 on tab1.ID=tab3.ID
    where tab1.FLAG<>1;

    三个表tab1, tab2, tab3的主键均为ID,其中tab1的字段FLAG只有0,1,2等有限个值。当三个表的数据达到2000万级时,耗时在100s以上。分析执行计划,发现因为有了条件“tab1.FLAG<>1”,而需要执行对tab1的全表扫描。

    考虑到FLAG的情况,首先在其上创建了一个位图索引以期进行优化。但不幸的是,FLAG=0的记录大约占全部记录的98%以上,FLAG=1的情况不足1%,导致优化器根本不考虑使用该位图索引。

    在进行多次尝试之后,终于找到一种方法实现了优化的目标。修改视图定义如下: 

    create or replace my_view
    as select
      tab1.ID, tab1.f1, tab1.f2,
      tab2.f3, tab2.f4,
      tab3.f5, tab3.f6
    from tab1
    left join tab2 on tab1.ID=tab2.ID
    left join tab3 on tab1.ID=tab3.ID
    where tab1.ID NOT IN (select ID from tab1 where FLAG=1);

    再查看select count(*) from my_view的执行计划,不再有tab1的全表扫描,并且已经利用上了刚创建的位图索引。在2000万级的情况下,用时约为2.1s。用户对此表示认可,问题解决。

     再进一步延伸,对于不支持位图索引的数据库(如MySQL),可以另建一张小表存储FLAG=1的记录,再将视图定义里的条件的子查询改为从该小表取ID即可。

  • 相关阅读:
    myBatsi调用存储过程
    Db2与Oracle的区别
    动态SQL与模糊查询
    一对多联表查询
    一对一联表查询
    025 资源的隔离与配置
    024 Yarn核心生态系统
    sift算法特征点如何匹配?
    Camera 图像处理原理分析
    基于灰度世界、完美反射、动态阈值等图像自动白平衡算法的原理、实现及效果
  • 原文地址:https://www.cnblogs.com/wggj/p/10608374.html
Copyright © 2011-2022 走看看