zoukankan      html  css  js  c++  java
  • [原创]Greenplum数据库集群实践

    GreenPlum实践
    
    ==============================================
      目录:
        一、安装环境准备
        二、GP数据库安装
        三、集群添加standby节点
        四、master和standby相互切换
        五、新增segment节点
        六、非Mirror模式为Segment节点增加Mirror
        七、Segment节点故障转移到Mirror并恢复segment
        八、迁移(替换)segment节点
        九、移除segment节点
        十、常用SQL和数据导入导出
        十一、GP集群中表的数据分布机制以及同步机制
    ==============================================
    
    一、安装环境准备
      机器IP             角色
      192.168.156.144   master
      192.168.156.145   segment1
      192.168.156.146   segment2
      192.168.156.200   standby
    
    Greenplum 需要在GP 数据库系统的所有主机(masters 和 segments) 上配置推荐的OS参数,以root用户登录,修改所有主机的OS参数
    (1)、关闭防火墙(三台主机)(学习时可以直接关闭,正式环境是通过开放端口)
      #service iptables stop   停止防火墙服务,重启电脑后仍然会开启
      #chkconfig iptables off  关闭防火墙服务开机启动,重启后生效
    (2)、修改/etc/hosts文件(三台主机)
      在hosts文件中添加或修改一下内容:
      192.168.156.144   master
      192.168.156.145   segment1
      192.168.156.146   segment2
      添加之后,可以通过ping命令测试是否正确,如:ping master测试是否能访问master节点
    (3)、修改或添加/etc/sysctl.conf(三台主机)
    kernel.shmmax = 500000000
    kernel.shmmni = 4096
    kernel.shmall = 4000000000
    kernel.sem = 250 512000 100 2048
    kernel.sysrq = 1
    kernel.core_uses_pid = 1
    kernel.msgmnb = 65536
    kernel.msgmax = 65536
    kernel.msgmni = 2048
    net.ipv4.tcp_syncookies = 1
    net.ipv4.ip_forward = 0
    net.ipv4.conf.default.accept_source_route = 0
    net.ipv4.tcp_tw_recycle = 1
    net.ipv4.tcp_max_syn_backlog = 4096
    net.ipv4.conf.all.arp_filter = 1
    net.ipv4.ip_local_port_range = 1025 65535
    net.core.netdev_max_backlog = 10000
    vm.overcommit_memory = 2
    (4)、配置/etc/security/limits.conf文件,添加以下内容(三台主机)
    * soft nofile 65536
    * hard nofile 65536
    * soft nproc 131072
    * hard nproc 131072
    (5)、设置预读块的值为16384(三台主机)
      # blockdev --getra /dev/sda         查看预读块,默认大小为8196
      # blockdev --setra 16384 /dev/sda   设置预读块
    (6)、设置磁盘访问I/O调度策略(三台主机)
      # echo deadline > /sys/block/sda/queue/scheduler
    (7)、上传并解压数据库安装文件(master节点)
      # unzip gpmaster.zip
      之后的目录文件如下:
      greenplum_path.sh - Greenplum 数据库环境变量配置文件
      GPDB-LICENSE.txt- Greenplum license 文件
      LICENSE.thirdparty- 第三方 license 文件
      bin- 目录下包括Greenplum 数据库管理程序,也包括PostgreSQL 客户端和服务程序
      demo - 目录下包括Greenplum 演示程序
      docs - Greenplum 数据库帮助文档(PDF 格式)
      etc - OpenSSL 配置文件
      ext - Greenplum 数据库程序用的附加程序( 如 Python)
      include - Greenplum 数据库C header files
      lib - Greenplum 数据库和 PostgreSQL 库文件
      sbin - Supporting/Internal 脚本和程序
      share - Greenplum 数据库共享文件
    
    二、GP数据库安装
    1、安装软件(master节点)
      在/etc/profile中增加:# source /usr/local/gpmaster/greenplum_path.sh,然后在三台主机执行命令:source /usr/local/gpmaster/greenplum_path.sh
    2.创建用户和节点文件
      # useradd gpadmin -m
      # passwd gpadmin
      在gpadmin账户下创建all_hosts,文件内容:(三台主机)
      master
      segment1
      segment2
    3.运行gpseginstall工具(master节点 /home/gpadmin)在所有节点上安装GP软件,完成后提示成功.
      # chgrp -R gpadmin /usr/local
      # chmod -R 0775 /usr/local
      # su - gpadmin
      # gpseginstall -f all_hosts -u gpadmin -p gpadmin
    4.切换到gpadmin用户验证无密码登录(三台主机)
      (1)切换用户
      # su - gpadmin
      (2)使用gpssh工具来测试无密码登录所有主机,结果如下图:
      # gpssh-exkeys -f all_hosts
      # gpssh -f all_hosts -e ls -l $GPHOME
    5.配置环境变量(master节点)
      在/home/gpadmin路径下,以root用户添加下述信息到.bashrc和.bash_profile文件最后
        # source /usr/local/gpmaster/greenplum_path.sh
      然后将.bashrc文件发送到segment1和segment2,命令如下:
        # scp .bashrc segment1:~
        # scp .bashrc segment2:~
    6.创建存储区域(master节点)
      (1)创建Master数据存储区域
        # gpssh -h master -e 'mkdir -p /data/master'
      (2)改变目录的所有权
        # gpssh -h master -e 'chown gpadmin:gpadmin /data/master'
      (3)创建一个包含所有segment主机名的文件/home/gpadmin/seg_hosts,内容如下:
        segment1
        segment2
      (4)使用gpssh工具在所有segment主机上创建主数据和镜像数据目录,如果没有设置镜像可以不创建mirror目录(切换gpadmin用户)
        # gpssh -f seg_hosts -e 'mkdir -p /data/primary'
        # gpssh -f seg_hosts -e 'mkdir -p /data/mirror'
        # gpssh -f seg_hosts -e 'chown gpadmin /data/primary'
        # gpssh -f seg_hosts -e 'chown gpadmin /data/mirror'
    7.同步系统时间,需要安装ntpd。# yum install ntp -y
      (1) 在Master主机上编辑/etc/ntp.conf来设置如下内容:
          server 127.127.1.0
      (2) 在Segment主机上编辑/etc/ntp.conf
          server master
      (3) 在Master主机上,通过NTP守护进程同步系统时钟(切换gpadmin用户)
          # gpssh -f all_hosts -v -e 'ntpd'
    8.验证操作系统设置(切换gpadmin用户)
      # gpcheck -f all_hosts -m master
      检查运行结果是否有error信息,如果有处理掉错误信息后重新执行上面的命令检查,直至没有error信息。目前知道的xfs相关的报错不影响安装。
    9.创建Greenplum数据库配置文件
      (1) 以gpadmin用户登录
        # su - gpadmin
      (2) 从模板中拷贝一份gpinitsystem_config文件
        # cp $GPHOME/docs/cli_help/gpconfigs/gpinitsystem_config /home/gpadmin/gpinitsystem_config
        # chmod 775 gpinitsystem_config
      (3) 设置所有必须的参数
        ARRAY_NAME="EMC Greenplum DW"
        SEG_PREFIX=gpseg
        PORT_BASE=40000
        declare -a DATA_DIRECTORY=(/data/primary)
        MASTER_HOSTNAME=master
        MASTER_DIRECTORY=/data/master
        MASTER_PORT=5432
        TRUSTED SHELL=ssh
        CHECK_POINT_SEGMENT=8
        ENCODING=UNICODE
      (4) 设置可选参数
        MIRROR_PORT_BASE=50000
        REPLICATION_PORT_BASE=41000
        MIRROR_REPLICATION_PORT_BASE=51000
        declare -a MIRROR_DATA_DIRECTORY=(/data/mirror)
    10.运行初始化工具初始化数据库
      # gpinitsystem -c gpinitsystem_config -h seg_hosts
      成功之后,数据库便启动了,出现Continue with Greenplum creation Yy/Nn>,输入 y,然后等待完成即可。初始化过程中遇到的报错如下:
      错误1:
      gpadmin-[FATAL][1]:-Failed Update port number to 40000
      解决:安装ed-1.1-3.3.el6.x86_64.rpm
      错误2:
      psql: FATAL:  DTM initialization: failure during startup recovery, retry failed, check segment status (cdbtm.c:1603)
      20180513:23:05:43:gpinitsystem:master:gpadmin-[FATAL]:-Failed to retrieve rolname. Script Exiting!
      解决:关闭防火墙。
    11.设置环境变量:
      添加"export MASTER_DATA_DIRECTORY=/data/master/gpseg-1"到~/.bashrc文件尾,并同步到segment1和segment2节点。
        # scp .bashrc root@segment1:~
        # scp .bashrc root@segment2:~
    12.启动和停止数据库测试是否能正常启动和关闭,命令如下:
      # gpstart -a
      # gpstop -a
    13.访问数据库:
      # psql -d postgres
      postgres=# select datname,datdba,encoding,datacl from pg_database;
    14.调整数据库参数,必须重新启动数据库:
      调整方法:执行命令 gpconfig -c 参数名 -v 参数值 -m Master节点值
      检查方法:重启数据库后,执行命令 gpconfig -s 参数名
      (1)调整
        #gpconfig -c shared_buffers -v 128MB -m 128MB
        #gpconfig -c gp_vmem_protect_limit -v 15360 -m 15360
        #gpconfig -c max_connections -v 1000 -m 200
        #gpconfig --skipvalidation -c wal_send_client_timeout -v 60s -m 60s 
      (2)查看:
        #gpconfig -s shared_buffers
        #gpconfig -s gp_vmem_protect_limit
        #gpconfig -s max_connections
        #gpconfig -s wal_send_client_timeout
      或者
        # psql -d postgres
        postgres=# show shared_buffers;
        postgres=# show gp_vmem_protect_limit;
        postgres=# show max_connections;
        postgres=# show wal_send_client_timeout;
    15.查看数据库状态:
      # gpstate
    
    三、集群添加standby节点
      1.在standby节点的/etc/profile添加:# source /usr/local/gpmaster/greenplum_path.sh
      2.所有节点的/etc/hosts中添加:# 192.168.156.200 standby的配置
      3.按照安装前准备配置standby主机,然后在master节点的all_hosts文件中添加standby,重新建立ssh互信(root和gpadmin两个用户都要),并复制必要的文件和环境变量。(在master上操作)
        # gpssh-exkeys -f all_hosts
        # gpssh -h standby -e 'mkdir -p /data/master'
        # gpssh -h standby -e 'chown gpadmin:gpadmin /data/master'
        # scp /usr/local/gpmaster standby:/usr/local/gpmaster
        # scp .bashrc standby:~
        # scp .bash_profile standby:~
      4.在master上执行以下命令初始化standby节点即可:
        # gpinitstandby -s standby
        # 如果是重新配置需要先删除原来的standby信息,然后在执行初始化:
        # gpinitstandby -r
        # rm -rf /data/master/*
        # gpinitstandby -s standby
    
    四、master和standby相互切换
      1.在master上执行以下命令模拟宕机
        # gpstop -m
      2.在standby上执行以下命令切换为master身份顶替原来的master
        # gpactivatestandby -d $MASTER_DATA_DIRECTORY
        # 执行之前需要在gpadmin用户下的.bashrc文件下添加一下两个环境变量,否则会报错。
        # export MASTER_DATA_DIRECTORY=/data/master/gpseg-1
        # export PGPORT=5432
      3.切换完成之后在原来的master上删除/data/master/gpseg-1目录,然后在standby(现在的master)上初始化master,把原来的master变成standby角色。
        # gpinitstandby -s master
      4.然后可以重复上述操作把master恢复成master角色。
    
    五、新增segment节点
      注:新增segment节点有两种情况:第一种是在集群中的原有机器中添加segment;第二种是新增主机,添加segment。Master节点存在Standby,
      GreenPlum认为Master有Standby,那么Segment就应该有Mirror,认为数据库开启了Mirror模式,如果实际segment没有mirror则查不到相关的资料,
      加入新节点会报错,以下操作在master执行了# gpinitstandby -r去掉集群的standby。
      1.按照安装流程把standby节点准备好,新加节点需要在master上的.bashrc文件指定#export PGDATABASE=dbtest环境变量,初始化时候需要把信息写到这个数据库。
      (本例是第二种把standby当成新节点加入,如果是第一种把newseg文件内容改为集群中现有的节点主机名即可,操作是一样的。)
      2.在master上新建newseg文件,内容为:standby,新加节点的主机名。
      3.执行安装前检查,如果有报错先进行处理。
        # gpcheck -f newseg
      4.检查ssh互信和时间
        # gpssh -f newseg -e date
      5.执行命令生成加入配置文件
        # gpexpand -f newseg
        # 输入y
        # 输入0或1 ,0表示只在新节点上初始化segment实例,1表示在所有segment节点初始化一个再加一个segment,新的节点是2个segment。这里输入0.
        # 生成gpexpand_inputfile_20180529_164324文件和gpexpand_inputfile_20180529_164324.fs文件(若还没有文件空间则没有.fs文件)
        # standby:standby:40000:/data/primary/gpseg2:4:2:p	--根据两个文件中的内容在各自的节点上创建好对应的目录并授权
      6.执行以下命令正式加入节点
        # gpexpand -i gpexpand_inputfile_20180529_164324 -S -V -v -n 1 -B 1 -t /tmp	--参数-S是表示用spread方式,不加是默认的group模式
        # 由于standby节点没有新建/data/primary目录导致报错执行# gpexpand -r -D dbdream回滚掉之前的操作,在回滚时也报错,发现数据库已经关闭,
        需要通过# gpstart -R将数据库启动到utility模式,然后回滚掉之前的添加Segment操作:gpexpand -r -D dbdream,回滚后再启动数据库# gpstart -a重新执行加入命令加入成功。
      7.segment添加成功之后如果需要将数据重分布则执行以下命令:
        # gpexpand -a -d 1:00:00 -D dbtest -S -t /tmp -v -n 1
        # 等待重分布完成
        # select * from gpexpand.expansion_progress;	--查看重分布进度
      8.清除gpextend产生的schema gpexpand
        # gpexpand -c -D dbtest
        # 输入两次y
    
    六、非Mirror模式为Segment节点增加Mirror
      1.在所有segment节点上创建mirror的数据存放文件和文件空间所需的目录(如果有文件空间)
        # mkdir /data/mirror
        # chown -R gpadmin.gpadmin mirror
      2.在master节点上使用以下参数生成添加Mirror的参数文件
        # gpaddmirrors -o add_mirror
        # 输入mirror的数据目录:/data/mirror
        #生成文件内容如下,可以看到segment1对应的mirror0放到了segment2节点上,以此类推:
        # cat add_mirror 
        filespaceOrder=
        mirror0=0:segment2:41000:42000:43000:/data/mirror/gpseg0
        mirror1=1:standby:41000:42000:43000:/data/mirror/gpseg1
        mirror2=2:segment1:41000:42000:43000:/data/mirror/gpseg2
      3.执行以下命令正式添加mirror
        # gpaddmirrors -i add_mirror
        # 添加完成会提示通过gpstate –s命令来查看Mirror的状态,Use  gpstate -s  to check the resynchronization progress。
      4.查看mirror信息
        # gpstate -m
      5.数据库查看mirror的信息
        # select * from gp_segment_configuration order by dbid;
      6.把初始化standby接入集群。
        # gpinitstandby -s standby
      7.此时GP集群正常,拥有master,standby实例,3个segment实例和3个mirror实例。
    
    七、Segment节点故障转移到Mirror并恢复segment
      1.重启segment2节点主机,模拟segment2节点宕机。此时集群读写正常,但是standby节点的mirror切换为primary了,standby有两个primary,数据分布不均衡了。
      使用以下sql可以查看到各个节点之间的状态变化。(注意segment2重启后关闭iptables,否则执行# gprecoverseg 会很久并卡住)
        # dbtest=# select * from gp_segment_configuration order by 1;
         dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts 
        ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------
            1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  | 
            2 |       0 | p    | p              | c    | u      | 40000 | segment1 | segment1 |            43000 | 
            3 |       1 | m    | p              | s    | d      | 40000 | segment2 | segment2 |            43000 | 
            4 |       2 | p    | p              | s    | u      | 40000 | standby  | standby  |            43000 | 
            5 |       0 | m    | m              | s    | d      | 41000 | segment2 | segment2 |            42000 | 
            6 |       1 | p    | m              | c    | u      | 41000 | standby  | standby  |            42000 | 
            7 |       2 | m    | m              | s    | u      | 41000 | segment1 | segment1 |            42000 | 
            8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  | 
    
      2.恢复到原来的架构,有两种可能情况,第一种情况,当故障主机启动后,这台主机上的节点会自动启动,当然现在已经都是Mirror节点了,角色是不会切换的,
      而且数据是不一致状态。这种情况只需要使用gprecoverseg命令同步一下数据后,就可以切换到原来的架构了。第二种情况,当故障主机segment2启动后,
      这台主机上的节点并没有启动,而且在重启数据库时,这台主机上的节点也没有启动。以下操作针对第二种情况,需要使用gprecoverseg命令同步故障机节点的数据,
      如果数据量很大,同步要很长时间。
        # gprecoverseg
        # 会列出需要同步的节点,输入y
        # 数据同步完成,查看mirror节点的信息,mirror状态正常,但是当前角色还没有切换回来。# gpstate -m
      3.进行primary和mirror角色切换
        # gprecoverseg -r
        # 会列出需要切换的节点,输入y
        # 切换完成,使用gpstate –m查看mirror信息。
        # 使用# gpstate -e 命令有可能会看到主/备数据正在同步,这是正常的,过段时间同步好了再查看就正常了。
        # 还可以使用以下sql来查看数据库的切换信息,还有扩充segment和加mirror的信息
        # select * from gp_configuration_history;
    
    八、迁移(替换)segment节点
      # 这里迁移standby主机上的primary和mirror到master主机,如果是新机器则按照“新增一个segment节点”步骤执行到第四步初始化好机器,无需执行gpextend,
      迁移过程中gp集群会自动将其加入。(迁移segment节点还可以手动停掉segment实例:# pg_ctl stop -D /data/primry/gpseg1,然后停集群,拷贝segment数据目录到目的迁移主机上,只修改status为d的记录主机为目的迁移的主机名重启做恢复和角色切换即可。)
      1)在master主机上创建对应的目录
        # mkdir {primary,fspc_primary,mirror,fspc_mirror}
        # chown -R gpadmin.gpadmin primary fspc_primary mirror fspc_mirror
      2)查看集群的节点信息并备份:
        # pg_dump -t gp_segment_configuration -c -f ~/gp_segment_configuration.dat
        dbtest=# select * from gp_segment_configuration;
         dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts 
        ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------
            1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  | 
            4 |       2 | p    | p              | s    | u      | 40000 | standby  | standby  |            43000 | 
            7 |       2 | m    | m              | s    | u      | 41000 | segment1 | segment1 |            42000 | 
            8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  | 
            2 |       0 | p    | p              | s    | u      | 40000 | segment1 | segment1 |            43000 | 
            5 |       0 | m    | m              | s    | u      | 41000 | segment2 | segment2 |            42000 | 
            3 |       1 | p    | p              | s    | u      | 40000 | segment2 | segment2 |            43000 | 
            6 |       1 | m    | m              | s    | u      | 41000 | standby  | standby  |            42000 |
        dbtest=# select * from pg_filespace_entry;  --查看文件空间
         fsefsoid | fsedbid |        fselocation        
        ----------+---------+---------------------------
             3052 |       2 | /data/primary/gpseg0
             3052 |       3 | /data/primary/gpseg1
             3052 |       1 | /data/master/gpseg-1
             3052 |       4 | /data/primary/gpseg2
             3052 |       5 | /data/mirror/gpseg0
             3052 |       6 | /data/mirror/gpseg1
             3052 |       7 | /data/mirror/gpseg2
             3052 |       8 | /data/master/gpseg-1
            16471 |       1 | /data/fspc_master/gpseg-1
            16471 |       2 | /data/fspc_primary/gpseg0
            16471 |       3 | /data/fspc_primary/gpseg1
            16471 |       4 | /data/fspc_primary/gpseg2
            16471 |       5 | /data/fspc_mirror/gpseg0
            16471 |       6 | /data/fspc_mirror/gpseg1
            16471 |       7 | /data/fspc_mirror/gpseg2
            16471 |       8 | /data/fspc_master/gpseg-1
      3)停掉集群
        # gpstop -a
      4)master方式启动集群
        # gpstart -m
      5)修改集群的节点信息
        # PGOPTIONS="-c gp_session_role=utility" psql -d postgres
        # set allow_system_table_mods='dml'; --获取修改系统表的权限
        # update gp_segment_configuration set hostname='master',address='master',status='d' where (content=1 and role='m');
        # update gp_segment_configuration set mode='c' where (content=1 and role ='p');
        # update gp_segment_configuration set hostname='master',address='master',status='d' where (content=2 and role='p');
        # update gp_segment_configuration set role = CASE WHEN preferred_role='p' then 'm' ELSE 'p' END where content=2;
        # update gp_segment_configuration set mode='c' where (content=2 and role ='p');
        dbtest=# select * from gp_segment_configuration; --查看修改后的配置
         dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts 
        ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------
            1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  | 
            8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  | 
            2 |       0 | p    | p              | s    | u      | 40000 | segment1 | segment1 |            43000 | 
            5 |       0 | m    | m              | s    | u      | 41000 | segment2 | segment2 |            42000 | 
            6 |       1 | m    | m              | s    | d      | 41000 | master   | master   |            42000 | 
            3 |       1 | p    | p              | c    | u      | 40000 | segment2 | segment2 |            43000 | 
            4 |       2 | m    | p              | s    | d      | 40000 | master   | master   |            43000 | 
            7 |       2 | p    | m              | c    | u      | 41000 | segment1 | segment1 |            42000 |
      6)重启集群
        # gpstop -m
        # gpstart -a
        # 集群可以启动成功,但是会提示有2个segment需要恢复,此时standby节点上的segment不会启动了,相当于自动移除了。
      7)恢复master上的segment
        # gprecoverseg -F  --执行完全恢复
        # 输入y
        # 集群会自动在master上启动segment的进程并同步数据,但是此时master上的两个segment都是mirror,角色没有切换,需要手工切换,但是需要在数据同步完成之后执行。
        注意:恢复过程,数据越大,时间越长,需要注意使用# gpstate -m检查时,如果出现Resynchronizing字样,一定不能执行下一步操作,需要等状态变为Synchronized之后,
        才能继续下一步操作。
      8)数据同步完成后进行角色切换
        # gpstate -m  --查看数据是否同步完成
        # gprecoverseg -r
        # 输入y
        # gpstate -e  --切换后查看同步状态
        # 等待一段时间再次查看所有segment同步数据完成,状态正常。
      9)查看此时的节点信息和文件空间目录
        dbtest=# select * from gp_segment_configuration;  --节点的信息更新了
       dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts 
      ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------
          1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  | 
          8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  | 
          2 |       0 | p    | p              | s    | u      | 40000 | segment1 | segment1 |            43000 | 
          5 |       0 | m    | m              | s    | u      | 41000 | segment2 | segment2 |            42000 | 
          3 |       1 | p    | p              | s    | u      | 40000 | segment2 | segment2 |            43000 | 
          6 |       1 | m    | m              | s    | u      | 41000 | master   | master   |            42000 | 
          4 |       2 | p    | p              | s    | u      | 40000 | master   | master   |            43000 | 
          7 |       2 | m    | m              | s    | u      | 41000 | segment1 | segment1 |            42000 |
        dbtest=# select * from pg_filespace_entry;  --可以看到最后四行被更新了
         fsefsoid | fsedbid |        fselocation        
        ----------+---------+---------------------------
             3052 |       2 | /data/primary/gpseg0
             3052 |       3 | /data/primary/gpseg1
             3052 |       1 | /data/master/gpseg-1
             3052 |       5 | /data/mirror/gpseg0
             3052 |       7 | /data/mirror/gpseg2
             3052 |       8 | /data/master/gpseg-1
            16471 |       1 | /data/fspc_master/gpseg-1
            16471 |       2 | /data/fspc_primary/gpseg0
            16471 |       3 | /data/fspc_primary/gpseg1
            16471 |       5 | /data/fspc_mirror/gpseg0
            16471 |       7 | /data/fspc_mirror/gpseg2
            16471 |       8 | /data/fspc_master/gpseg-1
             3052 |       4 | /data/primary/gpseg2
            16471 |       4 | /data/fspc_primary/gpseg2
             3052 |       6 | /data/mirror/gpseg1
            16471 |       6 | /data/fspc_mirror/gpseg1
    
    九、移除segment节点
      # 移除segment节点有两种方式,第一种是采用替换segment的步骤将要移除的segment的实例迁移到其他segment节点;第二种是全备数据库,删除节点后重新恢复数据,
      大数据量场景下耗时长。以下操作是第二种,将master上的segment节点移除掉(这里的移除的segment是包含了primary和mirror的,
      若只有primary则第四步中不需要执行update操作,第五步不用# gprecoverseg恢复操作)。
      1)备份数据库
        # gp_dump --gp-d=/home/gpadmin/backup dbtest  --该命令会备份每个segment的自己那部分数据在各自节点的指定目录下
      2)关闭数据库
        # gpstop -a
      3)master模式启动数据库
        # gpstart -m
      4)登录数据库
        # PGOPTIONS="-c gp_session_role=utility" psql -d dbtest
        # set allow_system_table_mods='dml'; --获取修改系统表的权限
        # delete from gp_segment_configuration where dbid in (4,6);
        # update gp_segment_configuration set content = 1 where dbid = 7;
        # delete from pg_filespace_entry where fsedbid in (4,6);
        # update pg_filespace_entry set fselocation='/data/mirror/gpseg1' where fsefsoid=3052 and fsedbid=7;
        # update pg_filespace_entry set fselocation='/data/fspc_mirror/gpseg1' where fsefsoid=16471 and fsedbid=7;
        # gpstop -m
      5)启动数据库并查看节点是否删除,并且执行同步操作恢复mirror
        # gpstart -a
        # gpstate -s
        # gprecoverseg
        # gpstate -e
        # gpstate -m
      6)恢复数据,只需要将移除节点上backup目录下的数据重分布到集群即可。
        # psql dbtest -f /home/gpadmin/backup/gp_dump_0_*
    
    十、常用SQL和数据导入导出
      1.远程登录
        # create role usertest password 'test123' createdb login; //创建用户并授予登录和创建数据库的权限
        # alter role gpadmin with password ‘gpadmin’;
        # select rolname,oid from pg_roles; //查看用户信息
        # vi pg_hba.conf //添加以下内容
        host    all     gpadmin         192.168.156.145/32   md5
        # gpstop -u  //重新加载后才能使之生效,不需要重启数据库
        # psql -d dbtest -U gpadmin -h master -p 5432
      2.查看数据库集群的数据分布情况
        # select gp_segment_id,count(*) from tt group by 1 order by 1;
         gp_segment_id | count 
        ---------------+-------
                     0 |     4
                     1 |     5
                     2 |     3
      3.查看表空间和文件空间对应关系,默认只有pg_segment一个文件空间,上面有pg_default和pg_global两个表空间
        # select a.spcname,b.fsname from pg_tablespace a,pg_filespace b where spcfsoid=b.oid;
      4.新建表空间
        1)先创建文件空间,master节点和所有segment节点
        # mkdir /data/fspc_master && chown -R gpadmin.gpadmin /data/fspc_master  (master和standby节点都要创建)
        # gpssh -f seg_hosts -e 'mkdir /data/fspc_primary'
        # gpssh -f seg_hosts -e 'mkdir /data/fspc_mirror'
        # gpssh -f seg_hosts -e 'chown -R gpadmin.gpadmin /data/fspc_primary'
        # gpssh -f seg_hosts -e 'chown -R gpadmin.gpadmin /data/fspc_mirror'
        2)创建文件空间
        # gpfilespace
        # 输入表空间的名字,名字随便起,但是不能使用gp_开头,输入:tablespace1
        # 输入Segment节点的文件空间目录:/data/fspc_primary
        # 输入Mirror节点的文件空间目录:/data/fspc_mirror
        # 输入Master节点的文件空间目录:/data/fspc_master
        # 生成一个类似gpfilespace_config_20180529_195239的配置文件,这个文件可以自己创建和修改
        3)正式创建文件空间
        # gpfilespace --config gpfilespace_config_20180529_195239
        4)创建完文件空间,即可在文件空间上创建表空间,创建表空间必须使用support权限用户
        # create tablespace tbs1 filespace tablespace1;
        5)设置用户默认就使用新建的表空间
        # alter role gpadmin set default_tablespace='tbs1'; 
        # grant all on tablespace tbs1 to gpadmin;
        6)在创建数据库时,指定数据库使用的默认表空间
        # create database tt tablespace tbs1;
      5.修改表字段和CTAS(create table as select)的方式创表
        # alter table tt alter column tt type bigint;
        # create table t_ctas as select * from tt;
      6.加载和卸载数据(必须要超级用户)
        # copy命令导入导出都要经过master,效率低下,适合数据量小的场景。数据量大,需要并发导入导出使用外部表gpfdist工具,
        直接从segment节点导入导出。数据加载还可以使用gpload工具,需要使用yaml语言编写gpload工具的控制文件。
        1)copy命令数据加载
        # copy tt from '/home/gpadmin/tt.txt' with delimiter ',' null '' LOG ERRORS INTO TT_ERRS SEGMENT REJECT LIMIT 100;
        # 指定null参数时,包含空值的数据可以成功加载,但是可能会遇到字段类型不匹配的情况,也就是错误数据,解决这个问题可以修改数据文件中错误的数据,
        还可以通过指定记录并跳过错误数据,将正确的数据加载到数据库,这是常用的方法,毕竟大多数情况都不知道数据文件中存在多少错误的数据,也可以修改数据文件中空数据为N。
        2)copy命令数据卸载
        # copy tt to '/home/gpadmin/tt_output.txt' WITH DELIMITER AS ',';
        # 使用copy命令卸载数据时,空数据以N的方式卸载,N是null的转义
      7.查看表文件大小:
        # select pg_size_pretty(calc_partition_table('public','tt'));
        # select pg_size_pretty(pg_relation_size('tt'));
        # select pg_size_pretty(pg_database_size('dbtest'));
      8.查看活动会话:
        # select * from pg_stat_activity;
        # select pg_cancel_backend(procpid);  --杀死某次查询
        # select pg_cancel_backend(85475);
        # ps -ef | grep -i postgres | grep -i con
      9.表分析:
        # Vacuum analyze tt;
        # select * from pg_stat_user_tables where relname = 'tt';
      10.查看磁盘、数据库空间
        # SELECT * FROM gp_toolkit.gp_disk_free ORDER BY dfsegment;
        # SELECT * FROM gp_toolkit.gp_size_of_database ORDER BY sodddatname;
      11.查看日志
        # SELECT * FROM gp_toolkit.__gp_log_master_ext;
        # SELECT * FROM gp_toolkit.__gp_log_segment_ext;
      12.查看表占用空间
        # SELECT relname as name, sotdsize/1024/1024 as size_MB, sotdtoastsize as toast, sotdadditionalsize as other 
        FROM gp_toolkit.gp_size_of_table_disk as sotd, pg_class WHERE sotd.sotdoid = pg_class.oid ORDER BY relname;
      13.查看索引占用空间
        # SELECT soisize/1024/1024 as size_MB, relname as indexname FROM pg_class, gp_toolkit.gp_size_of_index 
        WHERE pg_class.oid = gp_size_of_index.soioid AND pg_class.relkind='i';
      14.查看锁
        # SELECT locktype, database, c.relname, l.relation, l.transactionid, l.transaction, l.pid, l.mode, l.granted, a.current_query 
        FROM pg_locks l, pg_class c, pg_stat_activity a WHERE l.relation=c.oid AND l.pid=a.procpid ORDER BY c.relname;
      15.查看队列
        # SELECT * FROM pg_resqueue_status;
      16.OBJECT的操作统计
        #SELECT schemaname as schema, objname as table, usename as role, actionname as action, subtype as type, statime as time FROM pg_stat_operations 
        WHERE objname = '<name>';
    
    十一、GP集群中表的数据分布机制以及同步机制
      1)GreenPlum数据库支持hash分布(DISTRIBUTED BY)和随机分布(DISTRIBUTED RANDOMLY)两种分布策略,hash分布会计算分布键的hash值,
      相似的hash值的数据会放到同一个Segment节点上,和hash分区算法有些类似,这样,同样的分布键的数据肯定会分布到同一个Segment节点,
      这样在多表关联的时候,如果关联字段都是分布键,就可以在每个Segment节点关联后,Segment节点把结果发送到Master节点,再由Master节点汇总,
      将最终的结果返还客户端。而随机分布则不能保证同样分布键的数据分布在同一个Segment节点上,这样在表关联的时候,就需要将数据发送到所有Segment节点去做运算,
      这样网络传输和大量数据运算都需要较长的时间,性能非常低下,GreenPlum数据库不建议需要多表关联的表使用随机分布,也不推荐使用随机分布。
      还有一点,因为每个Segment节点都是独立的PostgreSql数据库,只能保证在单个Segment几点的数据唯一性,而随机分布不能保证整体数据的唯一性,
      而hash分布,相同分布键的数据会分配到同一个Segment节点,这样在单个Segment节点保证数据唯一性,也就保证了整体数据的唯一性。hash分布也是GreenPlum数据库的默认分布方式。
      2)建表时如果不指定分布键和分布策略,如果表中包含主键,默认会选择主键为分布键,如果表上有唯一约束但没有主键,那么默认选择唯一字段作为分布键,
      否则默认使用第一个字段作为分布键,并且使用hash分布策略。GreenPlum数据库不支持同时存在两个唯一的字段(复合主键除外)。如果建表时指定的分布键不是主键,
      那么GreenPlum会把表的分布键改为主键字段,而不是指定的字段,但是SQL语句中指定的分布键必须包含主键字段,而且主键字段必须在SQL指定的分布键的第一列出现才可以,
      否则会导致SQL无法成功运行。另外,随机分布不支持主键和唯一键,因为随机分布保证不了整体数据的唯一性。
      3)master和standby之间是使用流复制机制同步数据的,同步的是元数据,所以一般情况下同步很快完成。segment的primary和mirror之间是采用文件同步的方式。
      4)greenplum的两种节点分布模式:grouped和spread。grouped模式,默认的节点分布方式,主机的mirror节点全部放在下一个主机上,在segment主机数非常多的情况下,
      至少允许两台主机挂掉;spread模式,主机的第一个mirror在下个主机,第二个mirror在次下个主机,第三mirror在次次下个主机,在segment主机数非常多的情况下,
      只可以挂掉一台主机。执行初始化命令:gpinitsystem加上-S,节点分布方式为spread,如:# gpinitsystem -c gpinitsystem_config -h seg_hosts -S
      或者是:# gpexpand -f new_seg -S。
    

      

  • 相关阅读:
    网络动态负载均衡算法分析
    .Net线程问题解答(转)
    Javascript中的类实现(转)
    Log4Net笔记(三)Layout使用以及扩展(转)
    数据结构之排序算法二:堆排序,快速排序,归并排序
    财付通接口(asp)
    数据结构之排序算法一冒泡排序,直接插入排序,简单选择排序
    类与类之间的关系图(Class Diagram,UML图)(转)
    select与epoll
    vnode 和 渲染函数、函数式组件
  • 原文地址:https://www.cnblogs.com/wsjhk/p/9116975.html
Copyright © 2011-2022 走看看