建立索引的原则:
1:查询频繁
2:区分度高
3:长度小
4: 尽量能覆盖常用查询字段.
索引长度:
1: 索引越短, 重复度越高,区分度越小, 索引效果越不好
2: 索引越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大--索引文件越大,增删改变慢,并且影响查询速度.
所以, 要在 区分度 + 长度 两者上,取得一个平衡.
使用技巧:如果从左边截取区分度较低,可以考虑从右边截取
惯用手法: 截取不同长度,并测试其区分度
- <span style="font-size:18px;">select count(distinct left(word,6))/count(*) from dict;
- +---------------------------------------+
- | count(distinct left(word,6))/count(*) |
- +---------------------------------------+
- | 0.9992 |
- +---------------------------------------+</span>
截取word字段长度,从1开始截取,计算字符前缀没有重复的字符占全部数据的比例
对于一般的系统应用: 区别度能达到0.1,索引的性能就可以接受.