zoukankan      html  css  js  c++  java
  • SQLServer Replication 常见错误(转)

    1. 错误:已将此(这些)订阅标记为不活动,必须将其重新初始化。需要删除NoSync 订阅,然后重新创建它们      

    use distribution
    go
    --查找状态不正常的发布
    select status,*from dbo.MSsubscriptions where status<>2
    --修改状态
    update dbo.MSsubscriptions set status=2where status<>2

      观察复制链是否能正常运行,正常后用tablediff比较发布链中的表数据是否一致
      还可以重新初始化快照,但是数据量大就是个悲剧。

    2. 错误:表、存储过程不存在以及表结构不一致等
    处理方法:
    a. 表或存储过程不存在:
       在订阅端对应的库中补齐缺失的对象;

       有一种比较奇怪的现象是订阅端表明明存在,但是同步链依然报错,此时可能有两种情况:
       第一: 表字段不一致,可以参照下面(b)的方式补齐表字段;
       第二: 表字段也一致,但是依旧报错,可以采取三种方式解决:
         a. 暂停同步链,然后再次开启,看是否能通过,如果不行,进行下面的步骤;
         b. 勾选掉同步链中报错的这个表,然后观察同步链,此时去掉了这个表的发布,错误一般都能过去,
            等到所有数据同步后,再将这个表勾选上,一般都能过;同步链正常后,在用TableDiff工具比较下
            这个表的数据;
         c. 如果b步骤依然报错,那就只能重建了。


    b. 列名'xxx' 无效
      可以通过以下语句查找缺失的字段对应的表

    复制代码
    --查找某个发布链中的某个字段(Rp_XXXX 发布名xxx 字段名)

    select a.name as table_name,b.name as column_name,(select'alter table '+a.name+' add '+b.name+''+
    (
    casewhen name='nvarchar'thencast(b.max_length/2ASvarchar)
    when name like'date%'or name='money'then''
    else name end )
    from sys.types where system_type_id=b.system_type_id ) as definition FROM dbo.sysarticles a WITH(NOLOCK) innerjoin sys.columns b WITH(NOLOCK)
    on a.objid=b.object_idinnerjoin dbo.syspublications c with(nolock) on a.pubid=c.pubid
    where c.name='Rp_XXXX'and b.name='xxx'
    复制代码

    3. 错误:.主键冲突
       处理方法:跳过错误
     
    错误完成后,需要比较两边数据是否一致(比下数据量就行了)

    复制代码
    ---------------跳过订阅机器上面的错误------------------------
    --
    ---------------------在分发机器上--------------------------
    --
    语法
    sp_helpsubscriptionerrors [ @publisher = ]'publisher'
    ,
    [ @publisher_db = ]'publisher_db'
    ,
    [ @publication = ]'publication'
    ,
    [ @subscriber = ]'subscriber'
    ,
    [ @subscriber_db = ]'subscriber_db'

    --get publisher subscriber
    select*from MSsubscriber_info

    --get publisher_db publication subscriber_db=publisher_db
    select*from MSpublications

    --example
    sp_helpsubscriptionerrors 'SQLw2k8','dbtranpub','dbtranpub_pub','SQLw2k8Subscriber','dbtransub'

    --获取xact_seqno 值

    ----------------------在订阅机器上---------------------------
    sp_setsubscriptionxactseqno [ @publisher= ]'publisher',
    [ @publisher_db= ]'publisher_db',
    [ @publication= ]'publication',
    [ @xact_seqno= ] xact_seqno

    --example
    sp_helpsubscriptionerrors 'SQLw2k8','dbtranpub','dbtranpub_pub',xact_seqno

    -------------------------------------------------------------------------------------
    复制代码

    4. 错误:应用复制的命令时在订阅服务器上找不到该行

       a. 可以采用“主键冲突”错误的处理方式,跳过错误,然后再用tablediff比较两个表的数据差;
       b. 在订阅端补充缺失的数据

    复制代码
    --使用如下语句找出错误号 
    select top 100 e.xact_seqno ,e.command_id,e.*
    from dbo.MSdistribution_history h
    join dbo.MSrepl_errors e on h.error_id=e.id
    where comments not like'%transaction%' --失败的代理
    order by id desc
    USE distribution;
    GO
    --当前msrepl_commands表中命令涉及表的分布情况
    WITH cte AS(
    SELECT  a.xact_seqno,b.entry_time,
    REPLACE(CONVERT(NVARCHAR(1024),
    SUBSTRING(a.command,17,1024)),'[dbo].[sp_MS','') commands
    FROM dbo.MSrepl_commands a(NOLOCK)
    JOIN MSrepl_transactions b(NOLOCK)
    ON a.xact_seqno=b.xact_seqno
    )
    SELECT SUBSTRING(commands,8,CHARINDEX(']',commands)-8),COUNT(1)
    FROM cte WHERE CHARINDEX(']',commands)>8
    GROUP BY SUBSTRING(commands,8,CHARINDEX(']',commands)-8)
    ORDER BY COUNT(1) DESC
    --用上面查到的具体事务序列号,查看复制组件执行的具体命令
    --在分发数据库上执行:sp_browsereplcmds,注意必须限定开始和结束xact_seqno
    sp_browsereplcmds '0x0000003B00000020000500000000','0x0000003B00000020000500000000'
    --结果如下
    article_id command
    1 {CALL [dbo].[sp_MSdel_dboUPCCodeTransaction] ('000000002 ')}

    --找到对应的对象
    select publisher_db,article From dbo.MSarticles where article_id=1and publication_id=(
    select publication_id from MSpublications with(nolock) where publication='Rp_xxx')

    --由sp_MSdel 可以知道,这条命令是一个删除语句,因为发布端的数据已经不存在,所以只能跳过;

    --如果是修改,需要验证上述数据在故障订阅服务器上是否存在,如果不存在,则补上。
    复制代码

    5. 错误:用户'xxx' 登录失败或者The process could not connect to Subscriber 'xxxx'.
       处理方法: 检查账号是否正确,能够登录到发布和订阅服务器,而且有相应的权限。

    6. 发布'xxx' 的初始快照尚不可用
       保证SQLSERVERAGENT已经运行,复制=》发布内容=》发布项目=》右击右侧的订阅=》重新初始化
       如果还不行,复制监视器--发布服务器--xxx--发布的项目--快照,看到进程未能创建文件“\\XXZ\SQLPUB\unc”,
       到该文件夹重新配置sql的帐号对该文件夹权限为"完全"。

    7. 进程未能从表“[dbo].[syncobj_0x3745373834413345]”向外大容量复制
       在写BCP 数据文件时发生I/O 错误(源: ODBC SQL Server Driver (ODBC); 错误代码: 0)
       解决方法:就是字符类型全部改为n类型的解决问题(char-nchar,varchar-nvarchar,ntext).

    8. 错误消息:
     "代理'xxxx' 在出错后正在重试。已重试了25 次。有关详细信息,请参阅Jobs 文件夹中的代理作业历史记录。”

      发生这个错误一般都是在一台机器上面有比较多的发布链,错误原因在于数据库对Replication使用内存的限制,
      我们需要更改这个限制来解决这个问题(最好是不要再一台机器上创建太多的发布链),方法如下:

      HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\SubSystems\
      点开Windows项,找到下面这些内容
      %SystemRoot%\system32\csrss.exe ObjectDirectory=\Windows SharedSection=1024,20480,768
      将最后的数字(不一定是这个数字,可能是等)改成1024 保存,重启即可。

      Windows2008 server 如果不是amdin用户可能会不让打开注册表,如果是管理组权限的话,可以到
      C:\windows\system32 下面找到regedit32.exe 文件,右键,然后将自己的账号添加到运行权限里面。

    9.--Cannot drop the database XXX because it is being used for replication
      exec sp_removedbreplication 'database'

    Use [distribution]   
    go  
    --查询1:通常事务序列号,查到command_id=1的执行语句  
    EXEC sp_browsereplcmds @xact_seqno_start='0x00044ED500008F3E00AB00000000',@xact_seqno_end='0x00044ED500008F3E00AB00000000'  
      
    --查询2:查看同步对象表(在以上结果集中找到article_id/publication_id栏位值)  
    select *From MSarticles where article_id=344   
      
    --查询3:同步命令太多时,查看可指定@command_id[如图1](必须可传@publisher_database_id[查询2])  
    EXEC sp_browsereplcmds   
        @xact_seqno_start='0x00044ED500008F3E00AB00000000'  
        ,@xact_seqno_end='0x00044ED500008F3E00AB00000000'  
        ,@publisher_database_id=4  
        ,@command_id=1       

    四、导致停止同步的操作有:

    a) 在订阅数据库上删除记录后,在发布数据库有对这条记录的操作时,导致同步停止,需要手工再对订阅【重新初始化】才能继续同步,还有其它操作等。

    b) 需要检查发布数据库的兼容级别:我们一般设置成2008,默认是2005(不支持data类型),兼容级别可以 “右键数据库 属性 选项里设置”。关于还有哪些兼容,可以查看官方文档

    c) 在SQL2012中,订阅服务器需要设置代理帐户权限,将【C:\Program Files\Microsoft SQL Server\110】设置为可写,要不然会报错,如图:

     

    解决方法1:(a更新、b、删除):在订阅端把缺少的数据行新增(根据以上出错ID加一条记录)或用导入导出方法(SQL语句同步指定以上ID).(原因:订阅端缺少数据行造成删除或更新找不到数据行而出错),

    不推荐以下方法(解决方法2、解决方法3)

    解决方法2:改同步存储过程接口把抛出错码判断去掉,会造成数据不同步,如果取消最好只取消删除时调用的存储过程(如:sp_MSdel_dboTableName)

    解决方法3:使用发布代理的SkipErrors参数来忽略跳过错误20598(会造成数据不同步,不能有效查找原因,需要对比环境数据(如表:记录数))如下图:

  • 相关阅读:
    屏幕录像大师2016【破解版】
    Hibernate demo之使用注解
    Hibernate demo之使用xml
    Hibernate 的<generator class="native"></generator>的不同属性含义
    java 动态实现接口
    c# emit 实现类的代理
    c# emit 动态实现接口
    java nio读取和写入文件
    java 读取Properties
    Java中利用MessageFormat对象实现类似C# string.Format方法格式化
  • 原文地址:https://www.cnblogs.com/zping/p/2630320.html
Copyright © 2011-2022 走看看