zoukankan      html  css  js  c++  java
  • 高效的索引

    如何建立理想的索引?

    • 查询频繁度
    • 区分度
    • 索引长度
    • 覆盖字段

    区分度

    假设100万用户,性别基本上男/女各为50W, 区分度就低。

    长度小

    索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).

    区分度高,长度小

    问题:如果让区分度高,而长度小?

    答:可以针对列中的值,从左往右截取部分,来建索引

    (1)截的越短, 重复度越高,区分度越小, 索引效果越不好
    (2)截的越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大–增删改变慢,并间影响查询速度.

    所以, 我们要在 区分度 + 长度 两者上,取得一个平衡。惯用手法:截取不同长度,并测试其区分度。

    假设我们有一张表:英语4级的单词表,里面有13324条记录,我们怎么给name字段加索引呢?

    这里写图片描述

    如果计算区分度?

    截取单词第1位的不重复数:select count(distinct left(name,1)) from dict

    总的数量:select count(*) from dict

    区分度:不重复数/总的数量,sql语句如下:

    select (select count(distinct left(name,1)) from dict) / (select count(*) from dict) as rate;

    然后按照这样的步骤把其他长度所对应的区分度给找出来,看一个这个图表,可以知道当长度为11的时候重复度仅仅为1%,我们可以考虑建立11位长的索引

    这里写图片描述

    alter table dict add index name name(11);

    左前缀不好区分的情况

    对于左前缀不易区分的列 ,建立索引的技巧

    如url列
    http://www.baidu.com
    http://www.web-bc.cn
    列的前11个字符都是一样的,不易区分, 可以用如下2个办法来解决

    (1)把列内容倒过来存储,并建立索引
    moc.udiab.www//:ptth
    nc.cb-bew.www//://ptth
    这样左前缀区分度大

    (2)伪hash索引效果
    同时存url和url_hash列

    #建表
    create table t10 (
    id int primary key,
    url char(60) not null default ''
    );
    
    #插入数据
    insert into t10 values 
    (1,'http://www.baidu.com'),
    (2,'http://www.sina.com'),
    (3,'http://www.sohu.com.cn'),
    (4,'http://www.onlinedown.net'),
    (5,'http://www.gov.cn');
    
    #修改表结构,添加urlcrc列
    alter table t10 add urlcrc int unsigned not null;

    在存储的时候,将url对应的crc32码一同插入到数据库中,然后按照urlcrc字段建立索引,然后查找的时候,我们在业务层中将对应的url转换为crc32进行查找,就可以利用上索引了。

    因为crc的结果是32位int无符号数,因此当数据超过40亿,也会有重复,但这是值得的.(索引长度为int4个字节)

    多列索引

    多列索引的考虑因素—列的查询频率 , 列的区分度, 注意一定要结合实际业务场景
    以ecshop商城为例, goods表中的cat_id,brand_id,做多列索引,从区分度看,brand_id区分度更高, 但从 商城的实际业务业务看, 顾客一般先选大分类->小分类->品牌,最终选择建立2个索引:
    (1)index(cat_id,brand_id)
    (2)index(cat_id,shop_price)

    甚至可以再加 (3)index(cat_id,brand_id,shop_price),3个冗余索引

    但(3)中的前2列和(1)中的前2列一样,所以可以再去掉(1),建立2个索引
    index(cat_id,price) 和 index(cat_id,brand_id,shop_price);

  • 相关阅读:
    <转>lua 调用 C函数
    <转>VC之获取CPU序列号
    <转> 求结构体偏移
    借助 FireBug 进行轻量级代码自动生成。
    内存盘配置IIS临时目录
    导出带有复合表头的Excel方案.
    左右互博之精简代码
    [转]JavaScript 秘密花园
    MVC中,Ajax Post 数组的实现方案
    Sql 存储过程 参数传递空字符串, 到SQL 端变成了 空格!!
  • 原文地址:https://www.cnblogs.com/cnsec/p/13407017.html
Copyright © 2011-2022 走看看