服务器性能优化方式:
- 空间换时间:对热点数据缓存,减少数据查询时间。
- 分而治之:将大任务切片,分开执行。HDFS、MapReduce类似原理。
- 异步处理:若业务链中某一环节耗时严重,则该环节将拉长业务链的整体耗时,可以将耗时业务采用消息队列异步化,从而缩短业务链耗时。
- 并行处理:采用多线程、多线程同时处理,提升处理速度。
- 离用户更近一点:如CDN技术,将静态资源放到离用户更近的地方,从而缩短请求静态资源的时间。
- 提升可扩展性:采用业务模块化、服务化的手段,提升系统的可扩展性,从而可根据业务需求实现弹性计算。
性能调优关注点:
硬件资源
CPU
CPU使用率过高的原因:
- 计算量大
- 非空闲等待
- 过多的系统调用
- 过多的中断
内存
内存使用率过高的原因:
- 过多的页交换
- 可能存在内存泄漏
IO
IO繁忙的原因:
- 读写频繁;磁盘的读写过程是物理动作,频繁的读写势必会使IO来不及处理。
网络
要关注服务器的出入口带宽。
操作系统
系统负载
系统负载指的是CPU就绪队列中任务数。若该值超过6,则表示系统负载较高了。
连接数
操作系统处于安全考虑,会限制操作系统的最大TCP连接数,所以如果服务器需要提供大龄服务的话,就需要修改TCP最大连接数。
服务端架构演进
1:单机结构
当系统访问量较小时,使用单机即可满足需求。
所谓单机,即应用程序、数据库均放在一台服务器上完成。
但单机的处理能力有限,当系统的访问量增加使,单机无法满足需求,从而就出现了集群结构。
2:集群结构
集群结构中,将数据库、应用程序分别放在多台服务器上,那么用户的请求究竟由哪台服务器处理呢?
这就由负载均衡服务器来控制。
负载均衡服务器分为两种:分别是TCP/IP的四层、七层进行负载分发。
四层负载分发常用的手段有:
- LVS:免费开源,性能不如F5;
- F5:硬件交换机,价格昂贵,性能较高。
七层负载分发常用的手段有:
- Tengine
- Nginx
- ATS
- Vanish
- Squid
- Harproxy
集群结构基本满足中小企业的业务需求,但它存在如下几个缺点:
- 所有业务均在一个war包中,耦合度过高。
- 所有业务均在一个war包中,代码不易于维护。
为了解决上述问题,因此出现了分布式结构。
3:分布式结构
3.1 微服务
在分布式结构中,将业务进行服务化。
所谓服务化,就是将一个完整的应用,根据逻辑功能拆分成多个子应用,每个应用都有各自独立的war包,部署在不同的服务器上。
服务化优点:
- 系统逻辑清晰,耦合度低。
- 可以根据服务的业务量合理分配计算资源。
- 问题更容易排查。
3.2 分布式数据库
分布式数据库就是对数据库进行分库分表、将数据片存储在不同数据库的不同表中,并在数据库存储层之上增加了数据访问层,可通过hash找到数据所处的库与表。
大多公司基于Mariadb开发自己的分布式数据库,改数据库之上建立数据访问层,用来实现分库分表,并对上层透明。
3.3 注册中心 Zookeeper
注册中心用来管理所有的分布式服务。
当A 服务 需要请求B 服务时,A 服务首先会从注册中心获取B 服务的IP,然后向该 IP 发起请求。
除此,当服务不可用,或增加新的服务时,配置中心就会相应地在服务列表中删除、增加该项服务。
学习总结自博客: