zoukankan      html  css  js  c++  java
  • 记录今天客户的SQLSERVER启动不起来( 错误9003)的解决过程2013-11-26

    记录今天客户的SQLSERVER启动不起来( 错误9003)的解决过程2013-11-26

    今天一大早上班就接到客户的电话,说:SQLSERVER启动不起来,业务系统使用不了

    于是我就使用QQ远程,帮客户解决问题


    环境

    先说一下环境

    客户环境:Windows2003企业版SP2 32位 SQL2005企业版 32位 SP4

    自己笔记本电脑环境:Windows7 SP1  32位  SQL2005个人开发者版 32位

    我的笔记本电脑的计算机名:joe

    客户电脑的计算机名:hs

    客户那边的master数据库大小:几MB

    业务系统是winform系统

    客户的环境是单机系统没有使用到域

    网络环境:客户那边的网速比较慢,用远程协助的时候比较卡

    为什麽要说明我自己笔记本电脑的环境呢?请大家继续耐心看下去


    检查

    先打开SQLSERVER配置管理器,启动SQLSERVER,发现SQLSERVER启动不起来

    于是我打开Windows EventLog,发现了下面错误

    SQLSERVER 错误9003:LSN无效(日志扫描号无效)
    "传递给数据库 'master' 中的日志扫描操作的日志扫描号 (2806:120:1) 无效。
    此错误可能指示数据损坏,或者日志文件(.ldf)与数据文件(.mdf)不匹配。
    如果此错误是在复制期间出现的,请重新创建发布。否则,如果该问题导致启动期间出错,请从备份还原。

    于是我就在自己的电脑上百度了一下这个错误

    搜索到这篇文章:sql server 错误9003:LSN无效(日志扫描号无效),对数据库的修复

    这篇文章里的数据库是用户数据库,用rebuild log,dbcc checkdb解决了问题

    悲催的是客户那边损坏的是master数据库


    想办法

    作为一个好的数据库工程师,一定要快速知道有哪些方法可以解决当前客户的问题

    这些方法有什么利弊,因为延迟一秒钟,就会造成客户更多的损失,客户的业务系统无法正常运作,后果可想而知

    由下面几个因素,我作出了一个选择

    网速比较慢,不方便在客户的电脑上写SQL语句

    客户那边的master数据库大小:几MB

    业务系统是winform系统

    选择:以前项目经理教我的一个方法,遇到SQLSERVER启动不起来

    可以用刚刚安装好的SQLSERVER的master数据库替换掉客户那边的master数据库

    这种方法有下面的弊端

    (1)你所用的数据库版本一定要和客户的一样

    (2)将SQLSERVER2012的master数据库给客户是不行的

    (3)服务器触发器,证书,链接服务器,登录用户等信息会丢失

    为什麽会有这些弊端,大家可以看一下下面的文章

    SQL Server 2008中的Service SID 介绍

     【SERVICE SID的引入】
    NT SERVICEMSSQL$KATMAI, NT SERVICESQLAgent$KATMAI和NT SERVICEClusSvc 其实都是Service SID所对应的名字。

    Service SID的引入,是为了解决多个Service可能同用一个service帐号所带来的安全隐患。

    如IIS 使用Network Service帐号,可能其他服务也使用Network Service帐号。

    为了使得IIS能够连接到SQL Server, 我们可能会把Network Service作为SQL Server的login, 但是这是不安全的。

    因为其他服务如果以Network Service做为启动帐号的话,也能访问SQL Server。

    为了解决这个问题,在SQL Server 2008/Windows Server 2008及以后

    我们有了SID这个概念,这样,不同的服务,即使服务启动帐号是相同的,它们的SID也是不同的。

    SQLSERVER2005
     
    SQLSERVER2012
    因为登录用户的机制在SQLSERVER2008的时候发生了变化,所以你所用的数据库版本不和客户的一样是不行的
    但是就算一样,也有弊端,客户的登录用户原本是下面的样子
    builtinadministrators
    hsadministrators
    hsSQLServer2005MSFTEUser$hs$MSSQLSERVER
    hsSQLServer2005MSSQLUser$hs$MSSQLSERVER
    hsSQLServer2005SQLAgentUser$hs$MSSQLSERVER
     

    但是如果我把自己的master数据库给客户的话,就会变成下面的样子

    如果客户的业务系统是B/S系统,会用到IIS,或者客户的环境是域环境,

    登录SQLSERVER需要使用Windows登录验证不是SQL登录验证,那么这样做就很麻烦了

    还有一个我自己电脑的SQLSERVER是个人开发者,客户的是企业版,不过之前也这样做过,发现没有什么问题


    开始实施

    弊端说完了,开始实施了

    第一步:先把我自己笔记本电脑上的SQLSERVER所有用户数据库全部分离,

    删除一些安装时候没有的登录用户只保留默认的登录用户,停止自己电脑的SQL服务,然后把master.mdf和mastlog.ldf复制出来,发给客户

    第二步:使用远程协助,把客户电脑里的master数据库master.mdf文件改名为master22.mdf

    mastlog.ldf文件改名为mastlog22.ldf

    然后把发过来的master数据库放进去data文件夹里

    第三步:启动SQLSERVER,由于当时没有截图,这里就不放截图了,这时候可以发现SQLSERVER成功启动了

    第四步:把我们的业务库重新附加进来

    第五步:删除原来业务库里的那个数据库用户gxhtsyrain

    第六步:新建登录用户gxhtsyrain并且映射到我们的业务库

    第七步:禁用sa用户

    由于不是替换msdb数据库,所以维护计划没有丢失


    错误日志

    我查看SQL ERRORLOG,发现了下面的错误

    无法启用数据库 "msdb" 中的 Service Broker,因为master与msdb 的 Service Broker 的ID不一样

    NT AUTHORITYSYSTEM登录失败

    由于我们没有用到 Service Broker技术,所以“无法启用数据库 "msdb" 中的 Service Broker”这个错误可以忽略

    而NT AUTHORITYSYSTEM登录失败,在文章SQL Server 2008中的Service SID 介绍中说到

    但是我们也不能认为有这几个SID的帐号,就能随便把其他的登录如NT AUTHORITYSYSTEM给删除。

    某些应用,如VSS Writer,Windows自动更新等,还是需要用服务启动帐号来进行处理。

    因为客户的SQLSERVER已经打了SP4补丁,不会再打补丁,所以就算用不了Windows自动更新也没有关系


    如果客户那边有做SQLSERVER的系统数据库备份

    我会这样做:

    第一步:先备份我自己笔记本电脑里的master数据库出来

    第二步:将客户那边的master.bak拿到自己的电脑里

    第三步:还原客户的master.bak到自己的SQLSERVER

    第四步:停止SQL服务,然后把master.mdf和mastlog.ldf复制出来发送给客户

    第五步:把客户电脑里的master数据库master.mdf文件改名为master22.mdf,mastlog.ldf文件改名为mastlog22.ldf

    第六步:然后把发过来的master数据库放进去data文件夹里

    第七步:启动SQLSERVER


    总结
    其实除了备份用户数据库之外,系统数据库的备份也是很重要的

    我们需要备份master和msdb这两个数据库

    我们当时部署业务系统的时候没有备份系统数据库,其实也是一个反面教材

    我的方法是基于我们的业务系统使用到SQLSERVER的功能就只有维护计划,所以作出上面的的解决方法

    如果用到很多SQLSERVER的相关技术的话,可能我的解决方法不是最好的

    我也希望大家能够提出您的意见和见解,或者您使用的方法比我还要好,更快速

    如有不对的地方,欢迎大家拍砖o(∩_∩)o

  • 相关阅读:
    Windows 上如何安装Sqlite
    StringBuffer类讲解
    Android Debug Bridge(adb)百度
    0117调试 (Logout调试)
    android cmd adb shell 出现 Device offline的状态下
    菜鸟:为什么要用不同的包 android
    0105Activity+Intent
    adb shell 后感
    0116sqlite
    iptables
  • 原文地址:https://www.cnblogs.com/lyhabc/p/3443985.html
Copyright © 2011-2022 走看看