zoukankan      html  css  js  c++  java
  • 对wait events 和statistics 的理解小记

    buffer busy waits

    说明buffer cache中有一些buffers被多个进程尝试同时访问。
    查看V$WAITSTAT观察各种类型buffer wait的统计信息。
    SELECT class, count FROM V$WAITSTAT WHERE count > 0 ORDER BY count DESC;

    也可以查看V$SESSION_WAIT观察当前buffer wait信息,其中P1-FILE_ID, P2- BLOCK_ID,



    再通过DBA_EXTENTS查找哪些SEGMENT争用
    Select * from v$session_wait where event=’buffer busy waits’
    SELECT segment_owner, segment_name
      FROM DBA_EXTENTS
     WHERE file_id = <&p1>
       AND <&p2> BETWEEN block_id AND block_id + blocks - 1;

    对于segment header争用
    1、很可能是freelist的争用,LMT中的ASSM可以解决问题。
    2、如果不能使用ASSM,可以增加FREELIST数量,还不行就使用FREELIST GROUP
    查看segment 的freelist 情况:
    SELECT SEGMENT_NAME, FREELISTS
      FROM DBA_SEGMENTS
     WHERE SEGMENT_NAME = segment name
       AND SEGMENT_TYPE = segment type;

    对于data block争用
    1、优化sql,避免使用选择性差的index
    2、使用LMT中的ASSM,或增加FREELIST避免多个进程同时插入数据到相同的块。

    对于undo header争用
    使用automatic undo 管理,或者增加rollback segments

    对于undo block争用
    使用automatic undo 管理,或者增大rollback segments size

    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

    free buffer waits

    发现找不到free buffer,而通知dbwr 将脏数据写入磁盘,以获得free buffer。
    形成等待dbwr完成的因素有:
    1、 IO慢,异步磁盘,使用raw device
    2、 等待某些资源,比如latches
    3、 Buffer cache 太小,使得dbwr花费很长的时间用来写脏数据
    4、 Buffer cache 太大,使得dbwr没有能力写出足够的脏数据来满足需求。

    检查哪里阻塞了DBWR
    1、 检查V$FILESTAT看哪里发生了最多的write操作
    2、 检查操作系统的IO情况
    3、 检查CACHE是否太小,查看buffer cache hit ratio是否很低,使用V$DB_CACHE_ADVICE 判断是否应该增大CACHE
    4、 如果CACHE足够大,IO也没有问题,则考虑使用异步IO,或者多个DBWR进程,以满足负载
    调整DB_WRITER_PROCESSES参数(from DBW0 to DBW9 and from DBWa to DBWj),适用于多个CPU(at least one db writer for every 8 CPUs) or multiple processor groups (at least as many db writers as processor groups)
    5、 DBWR_IO_SLAVES

    LATCH FREE


    1、 检查在等待什么类型的LATCH,比如shared pool latch, cache buffer LRU chain
    检查V$SESSION_WAIT
    P1-Address of latch  p2- Latch number  p3- 休眠等待次数
    SELECT n.name, SUM(w.p3) Sleeps
      FROM V$SESSION_WAIT w, V$LATCHNAME n
     WHERE w.event = `latch free'
       AND w.p2 = n.latch#
     GROUP BY n.name;

    2、 检查LATCH对应的资源使用情况,比如library cache latch竞争严重,则检查the hard and soft parse rates
    3、 检查存在LATCH竞争的SESSION所执行的SQL,是否需要优化。

    Shared Pool and Library Cache Latch Contention

    主要问题出在parse
    1、 Unshared SQL
    手工检查那些只有一次执行的SQL是否相似:
    SELECT sql_text  FROM V$SQLAREA
     WHERE executions < 4  ORDER BY sql_text;
    或者:
    SELECT SUBSTR(sql_text,1, 60), COUNT(*)
      FROM V$SQLAREA
     WHERE executions < 4
     GROUP BY SUBSTR(sql_text, 1, 60)
     HAVING COUNT(*) > 1;

    2、 Reparsed Sharable SQL
    SELECT SQL_TEXT, PARSE_CALLS, EXECUTIONS
    FROM V$SQLAREA
    ORDER BY PARSE_CALLS;
    当PARSE_CALLS和EXECUTIONS相近的时候,说明进行了REPARSE。优化这些SQL

    3、 By Session
    检查是否某个session执行了很多的parse。最好结合时间,看parse率
    SELECT pa.sid, pa.value "Hard Parses", ex.value "Execute Count"
      FROM v$sesstat pa, v$sesstat ex
     WHERE pa.sid=ex.sid
       AND pa.statistic#=(select statistic#
           FROM v$statname where name='parse count (hard)')
       AND ex.statistic#=(select statistic#
           FROM v$statname where name='execute count')
       AND pa.value>0;

    cache buffer lru chain

    保护buffers在cache中的链,将buffer增加,移动,移出list时,必须要事先得到这个latch。
    由大量buffer输入输出引起,比如低效的SQL重复访问不合适的index (large index range scans) or many full table scans。读Buffer会引起buffer在LUR中的移动。
    查看Statements with very high logical I/O or physical I/O, using unselective indexes
    或者CACHE太小,DBWR不能及时写出脏数据,而使前台进程花费很长的时间保持着latch去寻找free buffer。

    cache buffers chains

    用来当从buffer cache中查找、增加、删除buffer时获得。体现为某些数据块被严重争用,即热点块。

    cache buffer lru chain latch 和cache buffers chains latch的区别:

    关键点在于他们保护的数据结构不同:前者保护LRU chain pointer。LRU chain 用来发现free buffers,移动热buffer到MRU端,并协助完成写脏数据和检查点等动作;后者用来保护hash chain。Hash chain 用来通过hash 算法(根据所在的文件和block id)访问cache在buffer中的blocks

    db file scattered read

    表示通过multiblock read将data读入到很多不连续的内存中(根据file_id/block_id,通过hash算法分布于不同的地方),通常发生于fast full scan of index,或者full table scan。
    查看V$SESSION_WAIT: P1-FILE_ID, P2-BLOCK_ID, P3-NUMBER OF BLCOKS(>1)

    在大型数据库中,通常物理读的等待和idle wait都排在最前面。当然也要考虑是否有以下的特征:
    Direct read wait(fts with parallel) / db file scattered read wait / Poor buffer cache hit ratio / 用户响应时间慢。

    查看哪些session正在进行全表扫描:
    SELECT s.sql_address, s.sql_hash_value,w.p1,w.p2
      FROM V$SESSION s, V$SESSION_WAIT w
     WHERE w.event LIKE 'db file%read' AND w.sid = s.sid ;

    查看是哪个对象
    SELECT segment_owner, segment_name
      FROM DBA_EXTENTS
     WHERE file_id = &p1 AND &p2 between block_id AND block_id + blocks - 1 ;

    查看是哪个sql
    SELECT sql_text
      FROM V$SQL
     WHERE HASH_VALUE=&sql_hash_value AND ADDRESS=&sql_address

    db file sequential read

    表示通过single block read将data读入到连续的内存中, 往往通过索引.
    查看V$SESSION_WAIT: P1-FILE_ID, P2-BLOCK_ID, P3-NUMBER OF BLCOKS(=1)
     

    direct path read and direct path read (lob)

    将数据从disk中直接读到PGA中,而绕过SGA. 通常发生在DSS或WH
    起因:
    1、 排序过大,不能在sort memory中完成,而转移到temp disk中。然后又读入,形成直接读。
    2、 Parallel slaves 查询
    3、 The server process is processing buffers faster than the I/O system can return the buffers. 表明了很大的IO load
    解决:
    1、 查询V$TEMPSEG_USAGE, 找出产生sort的sql;查询V$SESSTAT, 查看sort size的大小。
    2、 调整sql;如果WORKAREA_SIZE_POLICY=MANUAL, 增大SORT_AREA_SIZE;
    如果WORKAREA_SIZE_POLICY=AUTO, 增大PGA_AGGREGATE_TARGET
    3、 如果table 被定义为很高的degree of parallelism,将会引导optimizer使用parallel slaves 进行full table scan

    direct path write

    情况同read,等待直接从PGA中得到buffer,并写入磁盘。

  • 相关阅读:
    DFS 之 全排列
    蓝桥杯: 标题:第几个幸运数
    第K个幸运数字(4、7)
    C++将十进制数转化为二进制
    C++中数组声名后不初始化,数组里的值都是0吗?
    html和jsp区别
    中缀表达式转换为后缀表达式
    多个Activity之间共享数据的方式
    Jupyter Notebook入门教程
    Android之Activity生命周期详解
  • 原文地址:https://www.cnblogs.com/HondaHsu/p/793313.html
Copyright © 2011-2022 走看看