数据库优化

zoukankan html css js c++ java

数据库优化
SQL语句的优化

分析：确认程序是否存在查询不需要的记录；mysql是否在扫描额外记录
1、查询不需要的记录：使用select语句查询大量结果，然后再获取前N行（如新闻网站，取100条记录，只显示前面的10条），这时可以使用limit（limit 1，10；从1开始10行）
2、总是使用SELECT *，对I/O、内存消耗较大，不必要时不要这样。
3、子查询的性能又比外连接性能慢，尽量用外连接来替换子查询。
Select* from A where exists (select * from B where id>=3000 and A.uuid=B.uuid);
一种简单的优化就是用innerjoin的方法来代替子查询，查询语句改为：
Select* from A inner join B using(uuid) where b.uuid>=3000;
4、尽量少排序，排序操作会消耗较多的CPU资源（可以使用索引）
5、对于连续的数值，能用 between 就不要用 in 了：
select id from t where num between 1 and 3
6、切分查询，将大查询切分成小查询，每个查询功能一样，只完成一小部分，如果用一个大的语句一次性完成的话，则可能需要一次锁住很多数据、耗尽系统资源、阻塞很多小的但重要的查询。

索引的优化

1、建立索引加快查询性能，优先在经常搜索的字段上建立索引（where和order by）；
WHERE子句的查询条件里使用了比较操作符LIKE前置通配符%（如：LIKE “%ABC”），因为‘%’代表任何字符，%xxx不知道怎么去索引的，所以使用不了索引。只要列中包含有NULL值都将不会被包含在索引中
2、应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如：
select id from t where num=10 or num=20
可以这样查询：
select id from t where num=10
union all
select id from t where num=20
UNION 操作符用于合并两个或多个 SELECT 语句的结果集。请注意，UNION 内部的 SELECT 语句必须拥有相同数量的列。列也必须拥有相似的数据类型。不是同一个表也可以union只要列数相同，UNION 结果集中的列名总是等于 UNION 中第一个 SELECT 语句中的列名。UNION ALL允许重复
3、in 和 not in 也要慎用，否则会导致全表扫描，如：
select id from t where num in(1,2,3)
4、有函数的参数，不使用索引(避免在等号左边运算)
select * from user where age + 1 =20;
5、应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描
6、在多个列上建立独立的单列索引大部分情况下不能提高查询性能，可以使用复合索引（多列索引），key(name,age,sex)
多列索引有一个特点，即最左前缀（Leftmost Prefixing）。假如有一个多列索引为key(firstname lastname age)，当搜索条件是以下各种列的组合和顺序时，MySQL将使用该多列索引：
firstname，lastname，age
firstname，lastname
firstname
也就是说，相当于还建立了key(firstname lastname)和key(firstname)。但是只搜lastname用不到索引
7、由于复合索引最左前缀匹配，将搜索次数多的列放到最前列（建立B+树时从最左字段开始排序，第一个字段相同才排第二个字段，因为查找树需要一定的顺序）
8、尽量选择小而简单的数据类型做索引，减少磁盘空间
9、有时候需要索引很长的字符列，这会让索引变得大且慢。一个方式是使用哈希索引，另一个是使用前缀索引，即索引开始的部分字符串，这样可以节约索引空间，提高效率。但这样会降低索引的选择性（不重复的索引值/记录总数）。索引的选择性越高则查询效率越高，唯一索引的选择性是1，性能是最好的。一般情况，某个前缀的选择性也是足够高的。

数据库表结构的优化
- 选择合适的数据类型
  
  数据类型越小越好：尽量使用可以正确存储数据的最小数据类型（tinyint，占用更少的磁盘、内存、cpu缓存）；tinyint占1字节，int占4字节
  简单就好：如整型比字符操作代价更低（用整型存储ip地址）
- 避免NULL：最好指定列为NOT NULL，因为NULL更难优化，使用的索引更复杂
- 不要设计太多列：减少不必要的列适度冗余，减少join关联查询
- 适当拆分，水平拆分、垂直拆分
- 选择合适的字符编码：如果我们可以确定不需要存放多种语言，就没必要非得使用UTF8或者其他UNICODE字符类型，这回造成大量的存储空间浪费
MySQL配置文件优化

mysql的配置文件名为my.cnf（window为my.ini），不同情况下配置文件参数设置也不相同，应该根据具体场景调优。
InnoDB中最重要的选项是：
innodb_buffer_pool_size：缓存用户表（实际数据row）及索引数据的最主要缓存空间，对 Innodb 整体性能影响也最大，默认为8MB，建议设为内存的70%~80%（MyISAM只缓存索引）
innodb_log_file_size：日志文件大小，默认为48MB，应该调大，至少有几百MB

硬件的优化

CPU的选择

最好的选择是核心数多并且主频高的。但是有时考虑成本问题，可以参考以下情况：
如果不是密集型的查询，优先选频率高的，而不是数量多的
如果是密集型的、高并发的查询，比如秒杀等活动，优先选更多的cpu
因为一条sql语句只能在一个cpu上执行
内存的选择
内存并不是容量越大，性能提升越明显。如果内存大小已经超过了总数据量的大小，那么即使再增加内存，系能提升也不会特别明显。
内存频率选择cpu支持的最高的频率，品牌、型号、规格等要一致。

磁盘配置和选择

各种磁盘性能比较：
PCIe > SSD > Raid10 > 磁盘 > 网络存储
各种磁盘的特点和应用：
传统硬盘：需要考虑存储容量、传输速度、访问时间、主轴转速、物理尺寸等参数
raid增加传统硬盘性能：主服务器建议用raid10，从服务器可以raid0（raid0：数据等量放置在2块磁盘中，raid1：让同一份数据完整保存在两块磁盘）
SSD或者PCIe卡（FusionIO）：缺点比传统硬盘更容易坏
SSD应用场景：适用于存在大量随机I/O场景（SSD随机I/O快）、适用于解决单线程负载的I/O瓶颈（用在从服务器上，适用于读的
场景，频繁写会减少使用寿命）
网络存储场景（NAS、SAN）：数据库备份

操作系统

合理配置操作系统参数，选择合适的文件系统
查看全文

相关阅读:
洛谷1052——过河（DP+状态压缩）
mod4最优路径问题（转载）
初次接触python，怎么样系统的自学呢？
对AM信号FFT的matlab仿真
 初次使用自己写的testbench 验证了简单的NOT门。
写简单的tb（testbench）文件来测试之前的FSM控制的LED
利用简单的有限状态机(FSM)来实现一个简单的LED流水灯
 利用状态机(FSM)进行简单的uart串口发送数据
 用matlab脚本语言写M文件函数时用三种方法简单实现实现DFT（离散傅里叶变换）
作为新手对于初次接触matlab的一些感受。

原文地址：https://www.cnblogs.com/linmsen/p/11729619.html

SQL语句的优化

索引的优化

数据库表结构的优化

MySQL配置文件优化

硬件的优化

CPU的选择

磁盘配置和选择

操作系统