zoukankan      html  css  js  c++  java
  • Veritas NetBackup™ 状态码"十大"常见报错状态码

    我在刚开始学习Netbackup的时候,没少走弯路。经常会遇到各种稀奇古怪的 error 信息,遇到报错会很慌张,急需一个解决问题的办法。跟无头苍蝇一样,会不加思索地把错误粘到百度上,希望赶紧查找一下有没有好的处理问题的方法。

     

    今天就给大家列举 Netbackup中,最经典的十大错误案例,并附有处理问题的解决思路和方法,希望能给刚入行一些帮助,今后再遇到任何报错,我们都可以很淡定地去处理。

     

    学习任何一门技术的同时,其实就是自我修炼的过程。沉下心,尝试去拥抱技术的世界!

     

    Top  1状态码: 1  消息:请求的操作部分成功

    (在执行请求的操作的过程中, 检测到一个可能需要更正操作的问题。)

     

    解决方法:    

    1、确保该备份文件当前未被使用或修改。 检查文件或目录路径的长度是否超过了 1023 个字符。无法打开文件。检查文件的权限或目录中是否有隐藏文件

     

     如果是Archivelog备份,而且后续的备份均返回1。通常情况,需要进行Oracle 数据库的Archivelog同步。

    Oracle数据库Archivelog同步的方法为:

    以Oracle数据库用户登录到Oracle数据库服务上,通过RMAN来运行下面的命令:

    $ su – oracle

    $ rman

    RMAN> connect target /

    RMAN> change archivelog all validate;

    RMAN> exit

     如果是数据库在线全备份,需要查看备份脚本所在目录中的.out输出文件,查看哪部分没有备份成功,再进行相应处理。

     

     

    Top 2状态码: 2   消息: 请求的文件都未备份 

    (备份或存档操作未备份文件列表中的任何文件。

    此状态码主要在以下情况下出现:在使用 Lotus Notes 或 SQL Server 数据库代理进行自动备份时,所有与该作业相关的备份均已失败。或者,Enterprise Vault 备份已失败。在进行标准文件系统备份时不会出现该状态码。

    如果在进行 UNIX、Linux 或 Windows 文件系统备份时遇到此错误,或者在 SQL Server 或 Lotus Notes 以外的数据库代理中发生此错误,请打开技术说明 TECH38838) 中推荐的 NetBackup 支持案例。) 

     

    解决方法:

    根据需要,执行以下操作:

    • 下列信息仅适用于 Lotus Notes。

    在 UNIX 上,如果没有为 Lotus Domino Server 启用存档式日志记录,则会发生此错误。如果正在对事务日志进行另一个备份操作,也会发生此错误。

    单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

     

    客户端空间不足、卡进程、sql服务没有启动

    出现在sql数据库,客户端名字带域名,去客户端设置里修改

    看看磁盘使用情况

    看看脚本是否正常(注册表)

    看看客户端与SQL的连接是否已认证(SQL代理服务器)

     

     

    Top 3状态码: 6  消息:备份操作未能备份请求的文件 

    (所出现的错误导致用户备份失败。) 

     

    解决方法:

    验证您是否具有读取这些文件的权限。检查文件读取权限或 Windows上的用户权限。

    对于 数据库扩展客户机 (如 NetBackup for Oracle),这可能意味着 控制备份的脚本出现问题。详细信息请查看脚本的 Out 文件和错误信息。

     

    oracle归档问题,试试能否全备成功,oracle交叉验证

    rman target /

    allocate channel for maintenance device type disk connect 'sys/abc123@nfjd1';//改节点

    crosscheck archivelog all;

    delete force expired archivelog all;

    也有可能是客户端验证失败,在netbackup client service重新验证一下。(.out文件报错ORA-03113)

    也有可能是文件夹权限不足,开发/usr/openv文件夹权限后再进行oracle_link(.out文件报错ORA-19554)

     

     

    Top 4状态码: 13  消息: 文件读取失败

    ( 无法读取某个文件或套接字。) 

     

    可能的原因如下:

    • 在主服务器、介质服务器或某个客户端上发生网络通信问题。
    • 从文件系统进行读取时出现 I/O 错误。
    • 读取的文件不完整或已损坏。
    • 由于网络问题或写入套接字的进程出现问题而导致套接字读取失败。
    • 特定于 NetBackup Snapshot Client 的问题(请参见“推荐的操作”)。
    • 在 NetBackup 安装失败后,首先进行 EV-SQL 备份。

    请参见 NetBackup for Enterprise Vault Agent 管理指南的“故障排除”一节。

    • 在 Windows 平台上,NetBackup 为快照副本操作生成的文件列表可能没有足够的信息,无法从 tar32 副本还原。例如,因为尚未创建 tar32 副本,所以块编号信息不正确。
    • 对于双引导 VM,NetBackup 不支持策略的“启用从 VM 备份恢复文件”选项。
    • VMware VDDK 中的锁定超时可能会导致从同一 VMware 备份主机同时进行的 hotadd 备份失败。

    在 NetBackup 活动监视器中,详细状态日志可能包括如下类似消息:

    12/05/2014 06:43:53 - begin writing

    12/05/2014 06:48:53 - Error bpbrm (pid=2605) socket read failed:

    errno = 62 - Timer expired

    12/05/2014 06:48:55 - Error bptm (pid=2654) media manager terminated

    by parent process

     

    /NetBackup/logs/vxms 日志可能包含类似如下 VDDK 消息的重复实例:

    12/08/2014 05:11:35 : g_vixInterfaceLogger:libvix.cpp:1844 <DEBUG> :

    [VFM_ESINFO] 2014-12-08T05:11:35.146-06:00 [7F1B1163F700 info Libs']

    FILE: FileLockWaitForPossession timeout on '/var/log/vmware/hotAddLock.

    dat.lck/M34709.lck' due to a local process '15882-26732358(bpbkarv)'

    解决方法:

    根据需要,执行以下操作:

    • 检查 NetBackup 的“问题”报告,查找问题发生位置及原因的提示。
    • 检查网络通信是否正常运行。

    请参见 NetBackup 故障排除指南中的“解决网络通信问题”。

    • 对于 FlashBackup 客户端,检查 /var/adm/messages 日志,查找类似下面的错误:

    Mar 24 01:35:58 bison unix: WARNING: sn_alloccache: cache

    /dev/rdsk/c0t2d0s3 full - all snaps using this cache are now

    unusable

     

    此错误指示缓存分区不够大。如果可能的话,请增大缓存分区的大小。或者,如果多个备份使用同一个缓存,请减少并行备份的数量。要减少并行备份的数量,请重排其中的一些备份,或者将整个备份重排到文件系统活动较少的时间进行。

    • 要获取详细的故障排除信息,请为返回此状态码的进程创建调试日志目录。然后重试该操作并检查所生成的调试日志。
    • 确保已安装了所有产品和组件(SQL Server、Exchange、Notes 等)的最新 Service Pack 。
    • 确保整个环境中的所有网络硬件(NIC、集线器、交换机、路由器等)均设置为全双工,而不是半双工。
    • 针对系统中的 NIC 检查以下各项:
    • 在整个系统中升级到最新的 NIC 驱动程序。
    • 确保所有 NIC 均设置为全双工,而不是半双工。

    请参见 NetBackup 故障排除指南中的“对网络接口卡性能进行故障排除”。

    • 增加 NIC 的超时设置。
    • 如果实施了 NIC 合作,请将其停用,以便进行测试。
    • 在受影响的客户端或服务器上替换 NIC 本身。
    • 对于 NetBackup Snapshot Client,状态码 13 可能会显示在 /usr/openv/netbackup/logs/bpbkar 日志中。

    该日志可能会指出下列情况:

    • 要备份的文件驻留在 IDE 驱动器上而不是 SCSI 驱动器上。脱离主机备份方法设置为“NetBackup 介质服务器”或“第三方复制设备”。如果使用的是脱离主机备份,则包含客户端文件的磁盘必须是 SCSI 设备或光纤通道设备。

    如果磁盘是 IDE 驱动器,则在 /usr/openv/ netbackup/logs/ bpfis 日志中可能会看到下列内容:

    get_disk_info: FTL - /var/tmp/caa026fEU disk_inquiry failed.

    Errno = 25: Inappropriate ioctl for device

     

    在 /usr/openv/netbackup/logs/bpbkar 日志中可能会出现下列内容:

    bpbkar: INF - Processing /var

    bpbkar: ERR - get_disk_info() failed, status 13

    bpbkar: ERR - tpc_get_disk_info() failed: err 13

    bpbkar: ERR - bpbkar FATAL exit status = 13: file read failed

    bpbkar: INF - EXIT STATUS 13: file read failed

    • 要备份的文件位于未装入的文件系统上。必须装入被指定为快照源的文件系统。如果没有装入快照源但存在装入点,则 NetBackup 可能会尝试针对指定为快照源的目录的上一级目录创建快照。
    • 对于 NetBackup 介质服务器方法,可能需要增大客户端读取超时值。在某些环境中,NetBackup 需要的读取时间可能比默认值所允许的读取时间长。如果客户端读取超时不足,则备份可能会失败,并导致出现此错误。

    要增大所有客户端的客户端读取超时,请在“NetBackup 管理控制台”中,转到“主机属性”>“主服务器”>,双击主服务器,然后转到“属性”>“超时”。然后增大客户端读取超时。

    • 在 Windows 平台上,刷新“备份、存档和还原”客户端控制台,然后重试还原。此操作会刷新客户端控制台上显示的文件列表,并传递有关选定文件的正确信息。
    • 要防止 VMware VDDK 超时导致从同一 VMware 备份主机同时进行的 hotadd 备份失败,请执行下列操作之一:
    • 减少同时运行的 hotadd 备份数。
    • 根据需要增大介质服务器上的客户端读取超时(15 分钟或更长时间):

    在 NetBackup 管理控制台中,单击“NetBackup 管理”>“主机属性”> 双击主服务器 >“超时”>“客户端读取超时”

    单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

     

     

    Top 5状态码: 48 消息:找不到客户端主机名

    ( 系统函数 gethostbyname() 未能找到客户端的主机名。)

     

    解决方法:

    在下列位置验证客户端名称是否正确:

    • 主服务器上的 NetBackup 策略配置。
    • 下列对话框中的“常规”选项卡:“NetBackup 客户端属性”和“指定 NetBackup 计算机和策略类型”(在 Microsoft Windows 非目标客户端上)。要显示这些对话框,可在客户端上启动“备份、存档和还原”界面。对于“常规”选项卡,请单击“文件”菜单上的“NetBackup 客户端属性”;单击“文件”菜单上的“指定 NetBackup 计算机和策略类型”。
    • UNIX 和 Linux 客户端上的 bp.conf 文件。
    • 在客户端和服务器上,验证名称服务是否设置为能够正确解析 NetBackup 客户端名称。

    在 UNIX 客户端上,验证客户端的主机名是否在 /etc/hosts 文件、YP hosts 文件或 NIS 映射中。

    单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

     

     

    Top 6状态码: 57 消息:客户机连接被拒绝

    (客户机拒绝 bpcd 端 口号上的连接。)

     

    解决方法:

    发生这种情况的原因可能是 在该 bpcd 端 口没有进程监听,或者因为到该 bpcd 端 口的连接太多,超过了 网络子系统使用 listen()调用可以处理的数量。

     

     

    Top 7状态码: 71 消息:文件列表中的文件都不存在 

    (文件列表中的文件与客户机上的任何文件都不匹配。)

     

    解决方法:

    验证是否为此客户机指定了正确的文件列表。

    在 Windows 客户机上, 验证用来启动 NetBackup 客户机服务的帐户 是否有读取这些文件的权限。

     

     

    Top 8状态码: 156 消息:遇到快照错误

    (以下是出现此状态码的可能原因:

    • 与 VMware 相关的错误
    • Enterprise Vault Agent 相关错误。以下错误可能会导致状态码 156:
      • VSS_E_BAD_STATE 快照错误
      • VSS_E_INSUFFICIENT_STORAGE 快照错误
    • 与 Windows Open File Backup 或 Snapshot Client 有关的快照备份相关错误。
    • 将多个卷装入到同一个装入点上)

     

    解决方法:

    根据需要,执行以下操作:

    • NetBackup for VMware:
      • NetBackup 无法获取驱动器的卷 ID。

    NetBackup 可能无法获取驱动器的卷 ID。在此情况下,将不会备份任何虚拟机驱动器。备份失败,NetBackup 状态码为 156。

    驱动器可能会关闭。

    • 虚拟机的备份已处于活动状态

    每次只能对一个虚拟机运行一个备份。如果在第一个备份处于活动状态时启动虚拟机的第二个备份,则第二个作业将失败,状态码为 156。

    推荐的操作:请等到第一个作业完成后再运行第二个作业。

    • 无法找到虚拟机名称

    NetBackup 无法查找备份策略中列出的虚拟机的主机名或 VM 显示名称。详细状态日志可能包含以下错误消息:

    Critical bpbrm (pid=<pid number>) from client <client name>:

    FTL - snapshot creation failed, status 156.)

     

    如果虚拟机没有静态 IP 地址,可以将 NetBackup 配置为通过虚拟机的 VM 显示名称或 UUID 来识别虚拟机。不使用静态 IP 地址的环境包括群集和动态分配 IP 地址的网络等。

    请注意,可能已将 NetBackup 配置为通过虚拟机的 VM 显示名称来识别虚拟机。在这种情况下,请确保显示名称是唯一的,且不包含特殊字符。

    • 虚拟机已关闭

    通过 vCenter Server,NetBackup 可以备份已关闭的虚拟机。必须为 NetBackup 提供用于访问 vCenter Server 的凭据。

    如果 NetBackup 使用 ESX Server(而不是 vCenter)的凭据,则可能无法识别已关闭的虚拟机。请注意以下几点:

    • 如果策略使用 VM 主机名或 VM DNS 名称作为“主 VM 标识符”,NetBackup 可能找不到虚拟机。备份将失败。
    • 如果策略使用 VM 显示名称或 VM UUID 作为“主 VM 标识符”,NetBackup 则可以标识虚拟机。备份将成功。
    • 虚拟机有一个或多个独立磁盘且处于暂停状态

    如果具有独立磁盘的虚拟机处于暂停状态,则快照作业将失败。作业详细信息日志中将出现类似下面的消息:

    01/12/2015 17:11:37 - Critical bpbrm (pid=10144) from client

    <client name>: FTL - VMware error received: Cannot take a

    memory snapshot, since the virtual machine is configured with

    independent disks.

     

    以下 VMware 文章中提供了更多信息:

    http://kb.vmware.com/kb/1007532

    解决方法是,将虚拟机的状态更改为打开或关闭,然后重新运行备份。

    注意:

    不能使用快照捕获独立磁盘中的数据。将会备份虚拟机的其余数据。

    • 虚拟机的磁盘处于原始模式 (RDM) 下

    将忽略 RDM(不备份),并重新创建任一独立磁盘,但该磁盘是空的。

    • 创建快照的尝试超过 VMware 超时

    如果尝试创建虚拟机的快照超出 10 秒的 VMware 超时,快照将失败,并显示 NetBackup 状态 156。如果虚拟机配置了大量的卷,可能会发生该超时。请注意,即使禁用“虚拟机静默”选项,仍可能会遇到超时问题。

    执行以下操作之一:

    • 减少虚拟机中卷的数量。
    • 在虚拟机上安装 NetBackup 客户端,并为策略选择另一种备份方法(而不是 VMware 快照方法)。
    • 没有为虚拟机分配 vmdk 文件

    没有 vmdk 文件的虚拟机可以出现在 vCenter Site Recovery Manager (SRM) 环境中。如果复制虚拟机从未处于活动状态,则它处于被动模式,且可能没有 vmdk 文件。

    您可以在策略的“VMware 高级属性”选项卡上启用“忽略无盘 VM”选项。如果启用此选项:在 SRM 环境中,如果该虚拟机没有 vmdk 文件,NetBackup 就不会备份复制(被动)虚拟机。

    • vmdk 文件有太多增量文件

    只要发生 VMware 快照,就会为每个 vmdk 创建一个 delta.vmdk 文件。如果单个 vmdk 文件存在 32 个或更多此类增量文件,则 NetBackup 对该 VM 的备份可能会失败(状态为 156)。NetBackup 活动监视器的作业详细信息包含类似以下内容的消息:

    02/06/2015 10:33:17 - Critical bpbrm (pid=15799) from

    client fl5vm1_2012: FTL - vSphere_freeze: Unable to proceed with

    snapshot creation, too many existing delta files(44).

    02/06/2015 10:33:17 - Critical bpbrm (pid=15799) from client

    fl5vm1_2012: FTL - VMware_freeze: VIXAPI freeze (VMware snapshot)

    failed with 25: SYM_VMC_FAILED_TO_CREATE_SNAPSHOT

    02/06/2015 10:33:17 - Critical bpbrm (pid=15799) from client

    fl5vm1_2012: FTL - vfm_freeze: method: VMware_v2, type: FIM,

    function: VMware_v2_freeze

     

    要备份 VM,请执行以下操作:

    • 合并 VM 的快照。

    在 VMware 界面中,右键单击 VM 并选择“快照”>“合并”。有关更多信息,请参见 VMware 文档。

    • 确认 VM 的每个 vmdk 文件现在拥有的增量文件数少于 32 个。

    如果快照合并失败,请参见以下 VMware 文章以获取更多帮助:

    http://kb.vmware.com/kb/1004545

    • 重新运行 NetBackup 备份。
    • VMware 快照静默操作失败

    如果 NetBackup 策略可用于虚拟机静默(默认),vSphere 中的 VMware 快照操作将启动虚拟机静默。如果快照静默失败,则 NetBackup 作业失败,状态为 156。

    • 对于 Enterprise Vault Agent:

    请参见 NetBackup for Enterprise Vault Agent 管理指南的“故障排除”一节。

    • 对于使用 VSS 的 Windows Open File Backup 快照提供程序:

    请参见下列指南之一的“故障排除”一节:

    • NetBackup for VMware 管理指南
    • NetBackup for Hyper-V 管理指南
    • NetBackup Snapshot Client 管理指南
    •  
    • 对于使用 VSS 备份的文件数目来说,VSS 缓存文件可能太小。
    • 如果启用了 bpbkar 调试日志,则在备份的 bpbkar 调试日志中会出现类似如下的消息。
    • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: ERR -
    • failure reading file: D: test.file (WIN32 5: Access is denied.
    • )
    • 8:51:14.569 AM: [1924.2304] <4> tar_base::V_vTarMsgW: INF - tar
    • message received from dos_backup::tfs_readdata
    • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: ERR -
    • Snapshot Error while reading test.file
    • 8:51:14.569 AM: [1924.2304] <4> tar_base::V_vTarMsgW: INF - tar
    • message received from tar_backup::nextfile_state_switch
    • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: FTL -
    • Backup operation aborted!
    • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: INF -
    • Client completed sending data for backup
    • 8:51:14.569 AM: [1924.2304] <2> tar_base::V_vTarMsgW: INF - EXIT
    • STATUS 156: snapshot error encountered
    •  
    • 要使用 Windows 中的卷影副本配置增加 VSS 缓存大小,请按顺序执行下列操作:
      • 在 Windows 中,右键单击“我的电脑”,然后选择“管理”。
      • 在控制台树中,右键单击“共享文件夹”,选择“所有任务”,然后选择“配置卷影副本”。
      • 选择要进行更改的卷,然后选择“设置”。
      • 在“设置”对话框中,将“最大空间”设置更改为下列设置之一:“没有限制”或足够大的值,以满足安装和使用 VSS 的要求。
    • 对于使用 Snapshot Client 和 NAS_Snapshot 方法的备份(包含或不包含 SnapVault):
      • 如果备份失败并显示状态码 156,请查阅 /usr/openv/netbackup/logs (UNIX) 或 install_pathNetBackuplogs (Windows) 中的 bpfis 旧式日志。如果 bpfis 目录不存在,必须创建它并重新运行此作业。

    如有必要,提高日志记录级别并重试该作业。

    请参见 NetBackup 日志记录参考指南中的“关于日志”。

    • 在 Windows 客户端上,从使用 NAS_Snapshot 方法创建的备份还原文件时,请以管理员帐户登录 NetBackup 客户端服务,而不要以本地系统帐户登录。否则,备份失败,状态为 156。
      • 在 Windows 服务中,双击“NetBackup 客户端服务”。
      • 然后检查“登录”选项卡:如果没有以管理员帐户登录服务,则停止该服务。
      • 改用管理员帐户登录并重新启动服务。
      • 重试还原。

    单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

     

     

    Top 9状态码: 196 消息:因为备份时段已过,所以没有尝试进行客户机备份 

    (备份调度程序对其进行排队的备份或归档操作没有尝试执行,因为 备份时段不再打开。)

     

    解决方法:

    请检查是否有进程卡死,一直占用驱动器。

    如果有重启备份服务器或 介质服 务器的服务,重试备份。

    如果可能, 更改日程表, 为此策略和日程表组合延长备份时段的时间, 以便不再出现此错误。 如果必须运行该备份,请使用 “备份策略管理”窗口策略(Policy)菜单上 的手动备份(Manual Backup) 命令执行该备份。手动备份将忽略备份窗口。

     

     

    Top 10状态码:800

    消息: 资源请求失败 

    ( nbjm 进程无法获取作业所需的资源。此状态码附带有 EMM 原因字符串,该字符串出现在活动监视器的作业详细信息屏幕中以及 nbjm 调试日志中。EMM 原因字符串确定失败的资源请求的原因。)

     

    解决方法:

    找到 EMM 原因字符串,更正问题,然后重新运行该作业。

    对于某些通用的 EMM 原因字符串(如“磁盘卷已关闭”),可能需要生成某些报告来确定失败原因。可以通过在“NetBackup 管理控制台”中使用 bperror 或者各种日志条目报告(如“报告”>“磁盘报告”>“磁盘日志”)来生成此类报告。

    单击此处查看 Veritas 知识库中有关此状态码的技术说明和其他信息。

     

     

    今后还会继续总结 Netbackup中的各种报错处理思路与方法,希望跟各位老铁们,同学们一起努力。多沟通多交流!

  • 相关阅读:
    远程安装WinXP OEM版系统的痛苦经历
    许可证服务因许可证不够出现占用CPU的故障
    AvayaP133G2和3Com 3300交换机间的Vlan连接
    从win2000升级到win2003后ISA2000缓存的问题
    大型局域网中用ISA隔离部分计算机
    ORACLE学习第二天
    ORACLE ROWID解析
    ORA32773问题解决
    ORACLE学习第三天
    ORACLE表空间迁移
  • 原文地址:https://www.cnblogs.com/yihr/p/8931556.html
Copyright © 2011-2022 走看看