zoukankan      html  css  js  c++  java
  • postgres performance

    (1)和Oracle类似的dblink功能

    使用过oracle的人都知道,oracle有个很先进 的功能叫:dblink,能够在一个数据库中操作另外一个远程的数据库,比如:一个数据库在中国北京,另外一台数据库在中国上海,我可以在北京这台数据库 上面建立一个到上海数据库的dblink,然后可以在北京这台数据库上面对上海的数据库进行query或者update或者delete。这个先进的功能 在PostgreSQL的原代码的:contrib/dblink 中已经有了,大家可以像这样将他编译并安装到我们的数据库中。

    #cd contrib/dblink
    #make
    #make install


    假设我们的postgresql安装在:/home/pgsql中。

    make install后,在/home/pgsql/lib/中会有一个:dblink.so文件。这就是使用dblink必须的函数文件。另外,在 /home/pgsql/share/contrib中会有一个dblink.sql文件,这就是安装dblink.so的函数所需要的sql语句。

    大家可以像这样安装dblink的所有函数:
    #cat dblink.sql|psql

    函数安装成功之后,就可以使用dblink的所有先进功能了。
    大家可以先看看dblink.sql中的一些函数申明,让我们更了解他的作用。

    下面进入psql:
    pgsql=# select dblink_connect('host=localhost user=pgsql password=');
    dblink_connect
    ----------------
    OK
    (1 row)
    这个函数用来建立到远程数据库的连接。

    我们可以像这样想远程的数据库中insert一条记录:
    pgsql=# select dblink_exec('insert into student values(/'linux_prog/',/'12345/')');
    dblink_exec
    -------------------
    INSERT 22516276 1
    (1 row)

    现在我们检索我们刚才insert的记录:
    pgsql=# select * from dblink('select * from student') as student(name varchar(100),pass varchar(100));
    name | pass
    ------------+-------
    linux_prog | 12345
    (1 row)

    怎么样?刚才insert的记录已经在里面了。

    dblink的功能非常强大,我上面列举的只是他的最简单的应用。大家可以参考PostgreSQL的source code:
    contrib/dblink/sql/dblink.sql
    仔细看一下。

    (2)找出系统中性能很差的SQL,并加以优化

    我们在做Oracle系统管理的时候,经常做的事情是:
    首先看看系统中哪几条SQL的性能最差,通过linux命令:top -c找出该最前面的几个oracle进程的PID,然后在oracle的相关view中将这些SQL找出来,然后去看看这些SQL的execute plan,然后进行相关的优化。

    PostgreSQL也提供了这样先进的功能。

    首先,在postgresql.conf中把stats_command_string = true打开,使PostgreSQL的stats collector process监控每个session的sql语句。

    编写相关的脚本:
    viewsql.sh:
    #!/bin/sh

    ######################################################
    # viewsql.sh #
    # Author:linux_prog #
    # use to show all active session's sql in PostgreSQL.#
    ######################################################

    if test -z $1 ;then
    echo "Usage: $0 pid"
    exit 10
    fi

    echo "select * from (SELECT pg_stat_get_backend_pid(s.backendid) AS procpid, pg_stat_get_backend_activity(s.backendid) AS current_query FROM (SELECT pg_stat_get_backend_idset() AS backendid) AS s) as querystring where procpid=$1;" | psql


    这个脚本是显示指定的pid的session目前正在执行的sql语句。
    比如:
    我用top -c,结果是:
    3665 pgsql 15 0 124M 124M 122M R 30.0 2.1 0:04 postgres: pgsql pgsql [local] INSERT

    可以看到:3665这个pid显示在第一条,说明它的sql可能效率比较低。
    [pgsql@webtrends bin]$ ./viewsql.sh 3665
    procpid | current_query
    ---------+---------------------------------------------------
    3665 | insert into access_log select * from access_log ;
    (1 row)

    我们可以看到他正在进行的SQL语句,然后我们就可以对这些SQL进行性能的优化。
    如果,如果是一条select语句,执行速度狂慢的话,我们可以用explain来看看他的execute plan,看是否有合适的index或者是否是某个table很久没有analyze过了,等等。

    另外,可以提供一个KILL一个session的脚本,比如:有个session占用的资源太多,如果不kill掉他的话,可能会导致系统DOWN机。
    killsession.sh:
    #!/bin/sh
    ################################################
    # Author:linux_prog #
    # use to kill one session. #
    ################################################
    if test -z $1; then
    echo "Usage: $0 pid"
    exit 10
    fi

    SID=$1
    echo "select pg_cancel_backend($SID);"|psql

    比如:我执行:
    [pgsql@webtrends bin]$ ./killsession.sh 3665
    pg_cancel_backend
    -------------------
    1
    (1 row)

    刚才那个很占资源的session的目前的SQL操作就被cancel掉了。
    在3665的psql中会显示:
    pgsql=# insert into access_log select * from access_log ;
    ERROR: canceling query due to user request

    (3)清楚的知道每个table或者index的大小

    每 一个DBA都应该知道,IO的瓶颈是所有数据库性能的瓶颈。所以我们在设计表结构的时候,一定要尽量的减少每个字段的大小,只有这样,table的 size才会尽量的小。还有,我们在进行SQL调整的时候,首先做的,肯定是对大的TABLE的performance tuning。因此,我们很清楚的知道每个table或者index所占用的磁盘大小是很有必要的,在oracle中可以直接访问 dba_segments这个view来知道每个TABLE或者INDEX的大小。

    PostgreSQL的contrib/dbsize中也有这样的一个模块。

    大家可以像上面安装dblink那样安装dbsize.so。

    像这样查看table:access_log的大小:
    pgsql=# select relation_size('access_log')/1024/1024 ||'M' as dbsize;
    dbsize
    --------
    332M
    (1 row)

    像这样查看index:test_idx的大小:
    pgsql=# select relation_size('test_idx')/1024/1024 ||'M' as dbsize;
    dbsize
     
    --------------------------------
     

    PG里如何查看表,索引,表空间,数据库大小  

    2010-08-04 17:30:00|  分类: Postgres基础 |  标签: |字号 订阅

    --查询一个索引大小
     select pg_size_pretty(pg_relation_size('indexname))

    --查看一张表及此它上的索引总大小
    select pg_size_pretty(pg_total_relation_size('tablename'));

    --查看所有 schema里面索引大小,大到小的顺序排列:
    select indexrelname,pg_size_pretty( pg_relation_size(relid))                    
    from pg_stat_user_indexes where schemaname = 'schemaname' order by pg_relation_size(relid) desc;

    --查看所有 schema里面表的大小,从大到小顺序排列:
    select relname, pg_size_pretty(pg_relation_size(relid))
    from pg_stat_user_tables where schemaname = 'schemaname' order by pg_relation_size(relid) desc;

    --查看数据库大小:
    select pg_database.datname,pg_size_pretty(pg_database_size(pg_database.datname)) AS size
    from pg_database;

       
    --查看表空间大小
    select pg_tablespace_size('tbs_index')/1024/1024 as "SIZE M";   


    --------
    0M
    (1 row) 
     
    -------
     

    实现使用TOP  -d 1 ,然后shift + m 让其按照内存排序,查出那些postgres占有的内存或者CPU比较多。

    根据进程ID,使用ps -aux | grep postgres 查看哪些是select 进程,得到最终的进程ID。

    使用psql登入,用如下SQL查看这个进程到底再看什么
    select * from (SELECT pg_stat_get_backend_pid(s.backendid) AS procpid, pg_stat_get_backend_activity(s.backendid) AS current_query FROM (SELECT

    pg_stat_get_backend_idset() AS backendid) AS s) as querystring where procpid = '13392' ;

  • 相关阅读:
    [转]我是如何走进黑客世界的?
    Pycharm里面使用PIL库之后,为什么调用Image的方法不能弹出代码提示,怎样能让代码提示弹出?
    查看Windows系统里的进程已运行的时间
    pyinstaller将py文件转成exe格式
    谈谈关于Python里面小数点精度控制的问题
    python访问百度地图接口并返回信息
    解决RabbitMQ service is already present
    IntelliJ IDEA :Error:(1, 1) java: 非法字符: 'ufeff'
    Intellij IDEA调试功能总结
    Tomcat8 启动中提示 org.apache.catalina.webresources.Cache.getResource Unable to add the resource
  • 原文地址:https://www.cnblogs.com/kungfupanda/p/2446295.html
Copyright © 2011-2022 走看看