一、说明
在SQL Server 的作业中,有些时候我们希望步骤在执行失败后可以重复执行多几次,而我产生这个念头的是因为我在执行某个步骤(这个步骤对分区表进行修改分区方案、分区函数)的时候出现死锁了,如下面描述:
消息1205,级别13,状态55,第1 行
事务(进程ID 115)与另一个进程被死锁在锁资源上,并且已被选作死锁牺牲品。请重新运行该事务。
我想到解决这个问题的方法是重复执行多几次这个步骤(经测试执行几次可行),所以这里就讲讲如果让数据库作业完成这一动作。
二、测试实验
(一) 测试方案:
我们在作业中设置了简单的两个步骤,步骤1往表中插入一条数据,步骤2更新这条记录,让计数器+1,这就测试了成功时候,说明重复次数是没用的;对步骤2进行修改,让步骤2抛出一个异常,因为我们需要对表进行计数器+1,所以我们这里就抛出一个异常,扑捉到这个异常,进行计数器+1后,再把这个异常抛出去,抛第一个异常是模拟执行失败的,抛第二个异常就是让作业在失败情况下重复执行,因为使用TRY和CATCH后第一个异常就给捕获了。
(二) 创建表:
CREATE TABLE [dbo].[TestJobCounts]( [Id] [int] IDENTITY(1,1) NOT NULL, [Counts] [int] NULL, [UpdateTime] [datetime] NULL, CONSTRAINT [PK_TestJobCounts] PRIMARY KEY CLUSTERED ( [Id] ASC )WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY] ) ON [PRIMARY]
(三) 创建步骤1需要执行的存储过程:
-- ============================================= -- Author: <Viajar> -- Create date: <2011.09.14> -- Description: <插入数据> -- ============================================= CREATE PROCEDURE [dbo].[sp_Insert] AS BEGIN INSERT INTO [TestBackupDB].[dbo].[TestJobCounts] ([Counts] ,[UpdateTime]) VALUES (0 ,getdate()) END
(四) 创建步骤2需要执行的存储过程:
-- ============================================= -- Author: <Viajar> -- Create date: <2011.09.14> -- Description: <更新数据> -- ============================================= CREATE PROCEDURE [dbo].[sp_UpdateCount] AS BEGIN BEGIN TRANSACTION AltPS BEGIN TRY UPDATE [TestBackupDB].[dbo].[TestJobCounts] SET [Counts] = [Counts]+1 RAISERROR (N'This is message %s %d.', -- Message text. 13, -- Severity, 55, -- State, N'number', -- First argument. 5); -- Second argument. END TRY BEGIN CATCH IF @@TRANCOUNT > 0 PRINT 'Being ROLLBACK' ROLLBACK TRANSACTION AltPS--回滚 UPDATE [TestBackupDB].[dbo].[TestJobCounts] SET [Counts] = [Counts]+1 WHERE Id = (select max(id) from [TestJobCounts]) PRINT '失败' RAISERROR (N'This is message %s %d.', -- Message text. 13, -- Severity, 55, -- State, N'number', -- First argument. 5); -- Second argument. END CATCH IF @@TRANCOUNT > 0 BEGIN PRINT 'Being COMMIT' COMMIT TRANSACTION AltPS;--执行 PRINT '成功' END END
(五) 创建作业:
USE [msdb] GO /****** 对象: Job [测试作业执行次数] 脚本日期: 09/14/2011 11:36:51 ******/ BEGIN TRANSACTION DECLARE @ReturnCode INT SELECT @ReturnCode = 0 /****** 对象: JobCategory [[Uncategorized (Local)]]] 脚本日期: 09/14/2011 11:36:51 ******/ IF NOT EXISTS (SELECT name FROM msdb.dbo.syscategories WHERE name=N'[Uncategorized (Local)]' AND category_class=1) BEGIN EXEC @ReturnCode = msdb.dbo.sp_add_category @class=N'JOB', @type=N'LOCAL', @name=N'[Uncategorized (Local)]' IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback END DECLARE @jobId BINARY(16) EXEC @ReturnCode = msdb.dbo.sp_add_job @job_name=N'测试作业执行次数', @enabled=1, @notify_level_eventlog=0, @notify_level_email=0, @notify_level_netsend=0, @notify_level_page=0, @delete_level=0, @description=N'无描述。', @category_name=N'[Uncategorized (Local)]', @owner_login_name=N'sa', @job_id = @jobId OUTPUT IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback /****** 对象: Step [插入一条数据] 脚本日期: 09/14/2011 11:36:52 ******/ EXEC @ReturnCode = msdb.dbo.sp_add_jobstep @job_id=@jobId, @step_name=N'插入一条数据', @step_id=1, @cmdexec_success_code=0, @on_success_action=3, @on_success_step_id=0, @on_fail_action=2, @on_fail_step_id=0, @retry_attempts=0, @retry_interval=0, @os_run_priority=0, @subsystem=N'TSQL', @command=N'exec dbo.sp_Insert', @database_name=N'TestBackupDB', @flags=0 IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback /****** 对象: Step [执行多次存储过程] 脚本日期: 09/14/2011 11:36:52 ******/ EXEC @ReturnCode = msdb.dbo.sp_add_jobstep @job_id=@jobId, @step_name=N'执行多次存储过程', @step_id=2, @cmdexec_success_code=0, @on_success_action=1, @on_success_step_id=0, @on_fail_action=2, @on_fail_step_id=0, @retry_attempts=5, @retry_interval=1, @os_run_priority=0, @subsystem=N'TSQL', @command=N'exec dbo.sp_UpdateCount', @database_name=N'TestBackupDB', @flags=0 IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback EXEC @ReturnCode = msdb.dbo.sp_update_job @job_id = @jobId, @start_step_id = 1 IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback EXEC @ReturnCode = msdb.dbo.sp_add_jobschedule @job_id=@jobId, @name=N'执行时间', @enabled=1, @freq_type=4, @freq_interval=1, @freq_subday_type=4, @freq_subday_interval=10, @freq_relative_interval=0, @freq_recurrence_factor=0, @active_start_date=20110914, @active_end_date=99991231, @active_start_time=0, @active_end_time=235959 IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback EXEC @ReturnCode = msdb.dbo.sp_add_jobserver @job_id = @jobId, @server_name = N'(local)' IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback COMMIT TRANSACTION GOTO EndSave QuitWithRollback: IF (@@TRANCOUNT > 0) ROLLBACK TRANSACTION EndSave:
附图一:设置步骤之间的关系:
(图1)
附图二:设置步骤2失败时重试的次数以及每次重试的时间间隔,这里需要注意的是:1,如果步骤2执行成功,是不会执行重试的,直接就退出报告成功的作业了;2,这里重试次数设置为5,那么一共执行的次数就会是6次,因为要加上本身执行那一次;
(图2)
三、测试效果
(一) 执行中,注意状态中的重试间隔:
(图3)
(二) 执行完,这是重复执行了5次依然失败的效果图:
(图4)
(三) 查看表,发现Counts的数值是6,说明本身执行1次,外加重试执行5次:
(图5)
四、参考文献