zoukankan      html  css  js  c++  java
  • 索引长度和区分度

    建立索引的原则:

    1:查询频繁

    2:区分度高  

    3:长度小  

    4: 尽量能覆盖常用查询字段.


    索引长度:
    1: 索引越短, 重复度越高,区分度越小, 索引效果越不好
    2: 索引越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大--索引文件越大,增删改变慢,并且影响查询速度.

    所以, 要在  区分度 + 长度  两者上,取得一个平衡.


    使用技巧:如果从左边截取区分度较低,可以考虑从右边截取

    惯用手法: 截取不同长度,并测试其区分度

    [sql] view plain copy
     
    1. <span style="font-size:18px;">select count(distinct left(word,6))/count(*) from dict;   
    2. +---------------------------------------+  
    3. count(distinct left(word,6))/count(*) |  
    4. +---------------------------------------+  
    5. |                                0.9992 |  
    6. +---------------------------------------+</span>  

    截取word字段长度,从1开始截取,计算字符前缀没有重复的字符占全部数据的比例


    对于一般的系统应用: 区别度能达到0.1,索引的性能就可以接受.

  • 相关阅读:
    day34
    day33 UDP、进程
    Java RMI 框架(远程方法调用)
    Maven查看JAR包的依赖关系
    连接Oracle数据库的时候报了“Got minus one from a read call”
    Http、Socket和WebService协议之间的区别
    http 协议
    其它
    Jmeter-CSV data set config参数化
    英文
  • 原文地址:https://www.cnblogs.com/lpfuture/p/5773083.html
Copyright © 2011-2022 走看看