zoukankan      html  css  js  c++  java
  • 玩转SQL Server复制回路の变更数据类型、未分区表转为分区表

    玩转SQL Server复制回路の变更数据类型、未分区表转为分区表

    复制的应用:

    初级应用:读写分离、数据库备份

    高级应用:搬迁大型数据库(跨机房)、变更数据类型、未分区表转为分区表

    京东的复制专家 菠萝 曾经写过文章、在数据库大会上也做过演讲,但是我相信真正按照菠萝兄的文章自己去做一次实验的人应该不多

    京东的复制专家 菠萝 的文章地址:Replication的犄角旮旯(一)--变更订阅端表名的应用场景

    为什麽要玩转复制,大家想象一下:变更数据类型、未分区表转为分区表 这些业务场景经常都会发生,特别在数据量特别大的公司

    变更数据类型:没有其他特别好的办法,数据量大,锁表时间会比较长

    未分区表转为分区表:有时候一张表的数据量已经很多了,比如体积已经达到100G,那么这时候需要做表分区,方法是重建聚集索引或者导数据

    上面的方法不多不少都有一些缺陷,对于数据量特别大的情况下,如果超出业务的预期停机时间……菊花残,满地伤,被领导认为办事不力

     

    常见场景:

    1、变更其中的自增列主键,int-》bigint ,将表改为表分区

    2、100G+的大表

    3、单次最长停机时间:为1小时

    复制回路,一次搞定

    下面介绍一下,如何在一个实例下,通过三个数据库,建立一个复制回路,完成上面的需求

    实验环境:一台电脑,一个SQL Server实例,SQL Server2012, Windows7

    复制类型为事务复制 
     

    结构图

    从上图可以看出,由于都是在同一个实例,同一台机器下,所以机器磁盘需要有足够的磁盘空间!!

    因为[testloopbackA]库有一个[testAltertype]表100G,复制到[testloopbackB]库[testAltertype]表100G

    复制到[testloopbackC]库[testAltertype]表100G,最后复制回去[testloopbackA]库[testAltertype]表100G

    加上生成的快照文件,当然快照文件可能会压缩,但是一定要保证有足够的磁盘空间

    下面是具体演示

    1、建库脚本

    USE [master]
    GO
    
    /****** Object:  Database [testloopbackA]    Script Date: 2015/6/3 8:21:01 ******/
    CREATE DATABASE [testloopbackA]
     CONTAINMENT = NONE
     ON  PRIMARY 
    ( NAME = N'testloopbackA', FILENAME = N'D:DataBase	estloopbackA.mdf' , SIZE = 30720KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1024KB ), 
     FILEGROUP [FG_testChangepartition_Id_01] 
    ( NAME = N'FG_testChangepartition_Id_01_data', FILENAME = N'D:DataBase	estloopbackAFG_testChangepartition_Id_01_data.ndf' , SIZE = 24576KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1048576KB ), 
     FILEGROUP [FG_testChangepartition_Id_02] 
    ( NAME = N'FG_testChangepartition_Id_02_data', FILENAME = N'D:DataBase	estloopbackAFG_testChangepartition_Id_02_data.ndf' , SIZE = 24576KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1048576KB )
     LOG ON 
    ( NAME = N'testloopbackA_log', FILENAME = N'D:DataBase	estloopbackA_log.ldf' , SIZE = 2432KB , MAXSIZE = 2048GB , FILEGROWTH = 10%)
    GO
    
    
    
    USE [master]
    GO
    
    /****** Object:  Database [testloopbackB]    Script Date: 2015/6/3 8:22:11 ******/
    CREATE DATABASE [testloopbackB]
     CONTAINMENT = NONE
     ON  PRIMARY 
    ( NAME = N'testloopbackB', FILENAME = N'D:DataBase	estloopbackB.mdf' , SIZE = 30720KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1024KB ), 
     FILEGROUP [FG_testChangepartition_Id_01] 
    ( NAME = N'FG_testChangepartition_Id_01_data', FILENAME = N'D:DataBase	estloopbackBFG_testChangepartition_Id_01_data.ndf' , SIZE = 24576KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1048576KB ), 
     FILEGROUP [FG_testChangepartition_Id_02] 
    ( NAME = N'FG_testChangepartition_Id_02_data', FILENAME = N'D:DataBase	estloopbackBFG_testChangepartition_Id_02_data.ndf' , SIZE = 24576KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1048576KB )
     LOG ON 
    ( NAME = N'testloopbackB_log', FILENAME = N'D:DataBase	estloopbackB_log.ldf' , SIZE = 2432KB , MAXSIZE = 2048GB , FILEGROWTH = 10%)
    GO
    
    USE [master]
    GO
    
    /****** Object:  Database [testloopbackC]    Script Date: 2015/6/3 8:22:14 ******/
    CREATE DATABASE [testloopbackC]
     CONTAINMENT = NONE
     ON  PRIMARY 
    ( NAME = N'testloopbackC', FILENAME = N'D:DataBase	estloopbackC.mdf' , SIZE = 30720KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1024KB ), 
     FILEGROUP [FG_testChangepartition_Id_01] 
    ( NAME = N'FG_testChangepartition_Id_01_data', FILENAME = N'D:DataBase	estloopbackCFG_testChangepartition_Id_01_data.ndf' , SIZE = 24576KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1048576KB ), 
     FILEGROUP [FG_testChangepartition_Id_02] 
    ( NAME = N'FG_testChangepartition_Id_02_data', FILENAME = N'D:DataBase	estloopbackCFG_testChangepartition_Id_02_data.ndf' , SIZE = 24576KB , MAXSIZE = UNLIMITED, FILEGROWTH = 1048576KB )
     LOG ON 
    ( NAME = N'testloopbackC_log', FILENAME = N'D:DataBase	estloopbackC_log.ldf' , SIZE = 2432KB , MAXSIZE = 2048GB , FILEGROWTH = 10%)
    GO
    View Code

    下面分区方案和分区函数都在三个库上执行

    --1.创建分区函数
    CREATE PARTITION FUNCTION
    Fun_testChangepartition_Id(INT) AS
    RANGE LEFT
    FOR VALUES(2)
    
    
    --2.创建分区方案
    CREATE PARTITION SCHEME
    [Sch_testChangepartition_Id] AS
    PARTITION [Fun_testChangepartition_Id]
    TO([FG_testChangepartition_Id_01],[FG_testChangepartition_Id_02])

    建表脚本

    USE [testloopbackA]
    GO
    
    
    --更改数据类型
    CREATE TABLE [testAltertype](id INT IDENTITY(1,1) PRIMARY KEY,name NVARCHAR(100))
    GO
    --变分区表
    CREATE TABLE [testChangepartition](id INT IDENTITY(1,1) PRIMARY KEY,name NVARCHAR(100))
    GO
    
    --插入测试数据
    INSERT INTO [dbo].[testAltertype]
            ( [name] )
    VALUES  ( N'nihao'  -- name - nvarchar(100)
              )
    
    INSERT INTO [dbo].[testChangepartition]
            ( [name] )
    VALUES  ( N'nihao'  -- name - nvarchar(100)
              )
    
    
    SELECT * FROM [testAltertype]
    SELECT * FROM [testChangepartition]
    View Code

    2、在[testloopbackB]库先建好2个表

    USE [testloopbackB]
    GO
    
    --更改数据类型
    CREATE TABLE testAltertype_new(id BIGINT IDENTITY(1,1) PRIMARY KEY,name NVARCHAR(100))
    GO
    --变分区表
    CREATE TABLE testChangepartition_new(id INT IDENTITY(1,1) PRIMARY KEY,name NVARCHAR(100)) ON [Sch_testChangepartition_Id](id)
    GO

    3、创建[testloopbackA]库到[testloopbackB]库的发布,这一步很关键,因为在发布的时候需要修改项目属性,在发布属性里,还需要选择快照为字符类型

     testChangepartition_new表

     testAltertype_new表

     

     

    [testloopbackA]库到[testloopbackB]库的复制

    4、建立[pub_testloopbackAtotestloopbackB]发布的订阅

     

    5、在[testloopbackB]库里, 将[testAltertype_new]表和[testChangepartition_new]表里的id列里的不用于复制设置为"是"

     

    [testAltertype_new]表

    [testChangepartition_new]表

    6、测试

    在[testloopbackA]库的[testAltertype]表和[testChangepartition]表各插入一些记录

    USE [testloopbackA]
    GO
    
    --插入测试数据
    INSERT INTO [dbo].[testAltertype]
            ( [name] )
    VALUES  ( N'nihao2'  -- name - nvarchar(100)
              )
    
    INSERT INTO [dbo].[testChangepartition]
            ( [name] )
    VALUES  ( N'nihao2'  -- name - nvarchar(100)
              )
    
    
    SELECT * FROM [testAltertype]
    SELECT * FROM [testChangepartition]

    在[testloopbackB]库就能看到新插入的记录

    USE [testloopbackB]
    GO
    
    SELECT * FROM [dbo].[testAltertype_new]
    SELECT * FROM [dbo].[testChangepartition_new]

    在[testloopbackB]库里执行

    USE [testloopbackB]
    GO
    --查看分区架构文件组分布
    SELECT  CONVERT(VARCHAR(MAX), ps.name) AS partition_scheme ,
            p.partition_number ,
            CONVERT(VARCHAR(MAX), ds2.name) AS filegroup ,
            CONVERT(VARCHAR(MAX), ISNULL(v.value, ''), 120) AS range_boundary ,
            STR(p.rows, 9) AS rows
    FROM    sys.indexes i
            JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id
            JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.partition_scheme_id
            JOIN sys.data_spaces ds2 ON dds.data_space_id = ds2.data_space_id
            JOIN sys.partitions p ON dds.destination_id = p.partition_number
                                     AND p.object_id = i.object_id
                                     AND p.index_id = i.index_id
            JOIN sys.partition_functions pf ON ps.function_id = pf.function_id
            LEFT JOIN sys.Partition_Range_values v ON pf.function_id = v.function_id
                                                      AND v.boundary_id = p.partition_number
                                                      - pf.boundary_value_on_right
    WHERE   i.object_id = OBJECT_ID('testChangepartition_new')
            AND i.index_id IN ( 0, 1 )
    ORDER BY p.partition_number

    数据已经入到相应分区

    7、继续将[testloopbackB]库的[testAltertype_new]表和[testChangepartition_new]表复制到[testloopbackC]

    这一步需要注意:[testAltertype_new]表不需要再跟[testloopbackA]库到[testloopbackB]库的复制那样设置项目属性->XX_new,只需要保持默认就行了

    [testChangepartition_new]表跟刚才一样,需要设置项目属性->XX_new 

    先在[testloopbackC]库建好 [testChangepartition_new]表,[testAltertype_new]表不需要预先建立

    USE [testloopbackC]
    GO
    --变分区表
    CREATE TABLE testChangepartition_new(id INT IDENTITY(1,1) PRIMARY KEY,name NVARCHAR(100)) ON [Sch_testChangepartition_Id](id)
    GO

    8、建[testloopbackB]库到[testloopbackC]库的发布

     

    8、建立订阅[testloopbackC]库

     

    启动快照初始化

    然后需要对[testChangepartition_new]表设置不用于复制 为“是”

    [testAltertype_new]表不需要设置

    9、测试

    [testloopbackA]库插入的记录,[testloopbackC]库马上能看到

     

    USE [testloopbackC]
    go
    
    --查看分区架构文件组分布
    SELECT  CONVERT(VARCHAR(MAX), ps.name) AS partition_scheme ,
            p.partition_number ,
            CONVERT(VARCHAR(MAX), ds2.name) AS filegroup ,
            CONVERT(VARCHAR(MAX), ISNULL(v.value, ''), 120) AS range_boundary ,
            STR(p.rows, 9) AS rows
    FROM    sys.indexes i
            JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id
            JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.partition_scheme_id
            JOIN sys.data_spaces ds2 ON dds.data_space_id = ds2.data_space_id
            JOIN sys.partitions p ON dds.destination_id = p.partition_number
                                     AND p.object_id = i.object_id
                                     AND p.index_id = i.index_id
            JOIN sys.partition_functions pf ON ps.function_id = pf.function_id
            LEFT JOIN sys.Partition_Range_values v ON pf.function_id = v.function_id
                                                      AND v.boundary_id = p.partition_number
                                                      - pf.boundary_value_on_right
    WHERE   i.object_id = OBJECT_ID('testChangepartition_new')
            AND i.index_id IN ( 0, 1 )
    ORDER BY p.partition_number
    
    
    --分区区间
    --SELECT  *  FROM    sys.partition_range_values
    View Code

    数据入到相应分区

    10、跟第7步一样,但是这一次是[testloopbackC]库到[testloopbackA]库

    先在[testloopbackA]库建好 [testChangepartition_new]表,[testAltertype_new]表不需要预先建立

    USE [testloopbackA]
    GO
    --变分区表
    CREATE TABLE testChangepartition_new(id INT IDENTITY(1,1) PRIMARY KEY,name NVARCHAR(100)) ON [Sch_testChangepartition_Id](id)
    GO

    11、建[testloopbackC]库到[testloopbackA]库的发布

    12、建立订阅[testloopbackA]库

    启动快照初始化

    然后需要对[testChangepartition_new]表设置不用于复制 为“是”

    [testAltertype_new]表不需要设置

    13、测试

    [testloopbackA]库插入的记录,[testloopbackA]库马上能看到

    USE [testloopbackA]
    GO
    SELECT * FROM [dbo].[testAltertype_new]
    SELECT * FROM [dbo].[testChangepartition_new]

    USE [testloopbackA]
    go
    
    --查看分区架构文件组分布
    SELECT  CONVERT(VARCHAR(MAX), ps.name) AS partition_scheme ,
            p.partition_number ,
            CONVERT(VARCHAR(MAX), ds2.name) AS filegroup ,
            CONVERT(VARCHAR(MAX), ISNULL(v.value, ''), 120) AS range_boundary ,
            STR(p.rows, 9) AS rows
    FROM    sys.indexes i
            JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id
            JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.partition_scheme_id
            JOIN sys.data_spaces ds2 ON dds.data_space_id = ds2.data_space_id
            JOIN sys.partitions p ON dds.destination_id = p.partition_number
                                     AND p.object_id = i.object_id
                                     AND p.index_id = i.index_id
            JOIN sys.partition_functions pf ON ps.function_id = pf.function_id
            LEFT JOIN sys.Partition_Range_values v ON pf.function_id = v.function_id
                                                      AND v.boundary_id = p.partition_number
                                                      - pf.boundary_value_on_right
    WHERE   i.object_id = OBJECT_ID('testChangepartition_new')
            AND i.index_id IN ( 0, 1 )
    ORDER BY p.partition_number
    
    
    --分区区间
    --SELECT  *  FROM    sys.partition_range_values
    View Code

    数据进入到相应分区

    接下来就是找个适当的时间,比如凌晨, 停写, 拆复制, 改表名    打完 收工!!

     


    总结

    在搭建复制回路的过程当中,本人发现加字段是不行的,比如testloopbackA库testAddcolumn_new表有四个字段

    然后预先在testloopbackB库建立testAddcolumn_new表,并增加一个字段,在快照初始化的时候报错

    错误消息:
    进程无法向表“"dbo"."testAddcolumn_new"”进行大容量复制。 (源: MSSQL_REPL,错误号: MSSQL_REPL20037)
    获取帮助: http://help/MSSQL_REPL20037
    已达到文件末尾,缺少结束符或字段数据不完整
    若要获取详细说明初始化订阅表时所遇到的错误的错误文件,请执行在下面显示的 bcp 命令。有关该 bcp 实用工具及其支持的选项的详细信息,请参阅 BOL。 (源: MSSQLServer,错误号: 20253)
    获取帮助: http://help/20253
    bcp "testloopbackB"."dbo"."testAddcolumn_new" in "E:DataBaseReplDatauncNAME-PC_TESTLOOPBACKA_PUB_TESTLOOPBACKATOTES1cf7501620150604115556	estAddcolumn_2.bcp" -e "errorfile" -t"
    <x$3>
    " -r"
    <,@g>
    " -m10000 -SNAME-PC -T -w (源: MSSQLServer,错误号: 20253)
    获取帮助: http://help/20253

    方法一

    在这种情况下,我们可以采取跟MySQL主从一样的策略,建立好发布订阅之后,在订阅上添加字段,这时候订阅表会应用发布端发过来的DML和加字段DDL

    但是,基本上影响不是很大,当添加字段DDL执行完毕之后,就可以切表了

     

    方法二

    可以考虑在停机维护窗口添加或者考虑升级到SQL Server2012 ,SQL Server2012 对加字段已经作了一些修改

    对阻塞减少到最低

    相关文章:Sql Server 2012新特性 Online添加非空栏位.

    如有不对的地方,欢迎大家拍砖o(∩_∩)o 

  • 相关阅读:
    tomcat7配置
    C# FTP常规方法
    C++ 用libcurl库进行http通讯网络编程
    webkit webApp 开发技术要点总结[转]
    websocket
    Linux下使用logrotate实现日志切换
    Linux日志文件utmp、wtmp、lastlog、messages
    妙用git rebase --onto指令
    iptables命令详解和举例
    linux下IPTABLES配置详解
  • 原文地址:https://www.cnblogs.com/lyhabc/p/4540006.html
Copyright © 2011-2022 走看看