以一条普通的“select * from table order by …”语句为例。图2-21中显示为该语句在数据库中各个组件之间的处理过程,各个步骤分别代表:
(1)select语句通过网络传送给代理线程;
(2)SQL语句经过重写及编译,将编译结果存放在Package cache中;
(3)协调代理线程(coordinating agent)按照执行计划执行语句,将预取请求发送给预取线程;
(4)预取线程在容器间并行执行异步I/O,将数据页放入缓冲池中(如果没有发生预取,则略过第4步);
(5)将容器中的数据页放入缓冲池中;
(6)将需要排序的数据移动到排序堆中;
(7)如果排序堆不够,则将排序数据放到临时表空间中;
(8)排序完成的行被子代理送回客户端。
执行过程中要注意以下几个细节,这些细节也是影响性能的关键因素:
(1)SQL语句的执行计划可能会极端影响性能;
(2)如果发生预取,预取线程会从磁盘中取出连续的数据页,此时代理线程处于等待状态;
(3)如果没发生预取,则协调代理会并行地从磁盘中取出数据。
到此为止,一条select语句就彻底执行完了,我们可以看到,一条最基本的查询语句在DB2中经过各个组件的协调,历经了8个步骤最终完成。在遇到一个性能问题时,任何一个环节都可能成为性能瓶颈。
本文节选自《让DB2跑得更快——DB2内部解析与性能优化》
洪烨编著
电子工业出版社出版