zoukankan      html  css  js  c++  java
  • mysql查询优化

    关于数据量过大如何优化查询

    对于互联网公司来说,一周的数据量超过数十万甚至几百万已经是家常便饭,在这样一个数据爆炸的时代,找到一个好的数据库存储是非常重要的,mysql就是其中之一,但是,对于mysql来说,如果数据量超过100W,则查询的性能会下降得非常厉害。

    对于单表的查询优化

    在我看来,如果每个表的数据量最好在100W左右(特别是对于一些表的字段特别多的时候),如果字段比较少的话,可以达到500W,因为对于mysql来说,单表的性能仍是比较可观的。

    对于字段而言:

    • 尽量使用TINYINT、SMALLINT、MEDIUM_INT作为整数类型而非INT,如果非负则加上UNSIGNED
    • VARCHAR的长度只分配真正需要的空间
    • 使用枚举或整数代替字符串类型
    • 尽量使用TIMESTAMP而非DATETIME,
    • 单表不要有太多字段,建议在20以内
    • 避免使用NULL字段,很难查询优化且占用额外索引空间
    • 用整型来存IP

    索引:

    • 索引并不是越多越好,要根据查询有针对性的创建,考虑在WHERE和ORDER BY命令上涉及的列建立索引,可根据EXPLAIN来查看是否用了索引还是全表扫描
    • 应尽量避免在WHERE子句中对字段进行NULL值判断,否则将导致引擎放弃使用索引而进行全表扫描
    • 值分布很稀少的字段不适合建索引,例如"性别"这种只有两三个值的字段
    • 字符字段最好不要做主键
    • 不用外键,由程序保证约束
    • 尽量不用UNIQUE,由程序保证约束
    • 使用多列索引时主意顺序和查询条件保持一致,同时删除不必要的单列索引

    查询SQL:

    • 可通过开启慢查询日志来找出较慢的SQL
    • 不做列运算:SELECT id WHERE age + 1 = 10,任何对列的操作都将导致表扫描,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边
    • sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库
    • 不用SELECT *
    • OR改写成IN:OR的效率是n级别,IN的效率是log(n)级别,in的个数建议控制在200以内
    • 不用函数和触发器,在应用程序实现
    • 避免%xxx式查询
    • 少用JOIN
    • 使用同类型进行比较,比如用'123'和'123'比,123和123比
    • 尽量避免在WHERE子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描
    • 对于连续数值,使用BETWEEN不用IN:SELECT id FROM t WHERE num BETWEEN 1 AND 5
    • 列表数据不要拿全表,要使用LIMIT来分页,每页数量也不要太大

    升级硬件

    Scale up,这个不多说了,根据MySQL是CPU密集型还是I/O密集型,通过提升CPU和内存、使用SSD,都能显著提升MySQL性能

    参照:http://database.51cto.com/art/201608/515550.htm

  • 相关阅读:
    不懂就问」CPU 到底是怎么识别代码的?
    StackOverflow经典问题:代码中如何去掉烦人的“!=null"判空语句
    在 Excel 中使用正则表达式进行查找与替换
    从浅入深详解独立ip网站域名恶意解析的解决方案
    CentOS配置防火墙操作实例
    三步解决fiddler升级后https无法通过证书验证问题
    apache http跳转到https代码
    openssl命令行将pfx格式转.key和.crt文件,Apache适用
    宝塔面板常用命令大全!
    CentOS如何挂载硬盘
  • 原文地址:https://www.cnblogs.com/linyujin/p/10876133.html
Copyright © 2011-2022 走看看