不要在SQL Server中盲目地追求一句处理

来源:岁月联盟 编辑:zhuzhu 时间:2007-07-31

在日常的学习和工作中,我们可以经常发现在处理SQL Server的时,很多人都会有一句出结果的习惯,但值得注意的是,不恰当的合并处理语句,往往会产生负面的性能,本篇针对使用 UNION ALL 代替 IF 语句的合并处理做出一个简单的事例,用来说明这种方法会所带来的负面结果。

示例:

 

表A和表B,这两个表结构一致,为不同的业务服务,现在写一个存储过程,存储过程接受一个参数,当参数为0时,查询表A,参数为1时,查询表B。

 

1:一般处理方法:

 

IF @Flag = 0    SELECT * FROM dbo.AELSE IF @Flag = 1    SELECT * FROM dbo.B

 

 

 

2、一句处理方法:

 

SELECT * FROM dbo.AWHERE @Flag = 0UNION ALLSELECT * FROM dbo.BWHERE @Flag = 1

 

 

 

细化分析:

 

从语句的简捷性来看,方法b具有技巧性,它们两者之间,究竟那一个更好呢?你可能会从性能上来评估,以决定到底用那一种。单纯从语句上来看,似乎两者的效率差不多,下面通过数据测试来反映结果似乎和想像的一样。

 

建立测试环境:(注,此测试环境主要是为几个主题服务,因此结构看起来稍有差异)

 

USE tempdbGO SET NOCOUNT ON--======================================--创建测试环境--======================================RAISERROR('创建测试环境', 10, 1) WITH NOWAIT-- Table ACREATE TABLE [dbo].A(    [TranNumber] [int] IDENTITY(1, 1) NOT NULL,    [INVNO] [char](8) NOT NULL,    [ITEM] [char](15) NULL DEFAULT (''),    PRIMARY KEY([TranNumber])) CREATE INDEX [indexONinvno] ON [dbo].A([INVNO])CREATE INDEX [indexOnitem] ON [dbo].A ([ITEM])CREATE INDEX [indexONiteminnvo] ON [dbo].A([INVNO], [ITEM])GO -- Table BCREATE TABLE [dbo].B(    [ItemNumber] [char](15) NOT NULL DEFAULT (''),    [CompanyCode] [char] (4) NOT NULL,    [OwnerCompanyCode] [char](4) NULL,    PRIMARY KEY([ItemNumber], [CompanyCode])) CREATE INDEX [ItemNumber] ON [dbo].B([ItemNumber])CREATE INDEX [CompanyCode] ON [dbo].B([CompanyCode])CREATE INDEX [OwnerCompanyCode] ON [dbo].B([OwnerCompanyCode])GO --======================================--生成测试数据--======================================RAISERROR('生成测试数据', 10, 1) WITH NOWAITINSERT [dbo].A([INVNO], [ITEM])SELECT LEFT(NEWID(), 8), RIGHT(NEWID(), 15)FROM syscolumns A, syscolumns B INSERT [dbo].B([ItemNumber], [CompanyCode], [OwnerCompanyCode])SELECT RIGHT(NEWID(), 15), LEFT(NEWID(), 4), LEFT(NEWID(), 4)FROM syscolumns A, syscolumns BGO

进行性能测试:

 

DECLARE @a intSET @a = 1 DECLARE @t TABLE(    id int IDENTITY,    a int, b int)DECLARE @dt datetime, @loop int, @id intSET @loop = 0WHILE @loop < 5BEGIN    SET @loop = @loop + 1    RAISERROR('test %d', 10, 1, @loop) WITH NOWAIT    SET @dt = GETDATE()        SELECT [ITEM] FROM A        WHERE @a = 0            AND [ITEM] < 'A'        UNION ALL        SELECT [ItemNumber] FROM B        WHERE @a = 1            AND [ItemNumber] < 'A'    INSERT @t(a) VALUES(DATEDIFF(ms, @dt, GETDATE()))    SELECT @id = SCOPE_IDENTITY(), @dt = GETDATE()        IF @a = 0            SELECT [ITEM] FROM A            WHERE [ITEM] < 'A'        ELSE IF @a = 1            SELECT [ItemNumber] FROM B            WHERE [ItemNumber] < 'A'    UPDATE @t SET b = DATEDIFF(ms, @dt, GETDATE())    WHERE id = @idENDSELECT * FROM @tUNION ALLSELECT NULL, SUM(a), SUM(b) FROM @t

 

 

 

性能测试结果:

 

id  a       b--- ------- -------1   3410   20632   1703   16563   1763   16564   1800   17935   1643   1856NULL   10319  9024

 

 

 

从结果看,两者的性能差异很小,所以两者从性能上比较,可以视为没有差异。

问题所在:

 

虽然在性能上,两者没有什么差异,但另一个问题也许你从来没有考虑过,那就是对表的访问的问题,在方法A中,肯定只会访问到一个表;而在方法B中,情况还是如此吗?答案是否定的,方法B始终会扫描两个表。而这样的潜台词是,即使在我的查询中,只会用到A表,但如果B表被下了锁的话,整个查询就会被阻塞,而方法A不会。

 

为了证明这个问题,我们再做下面的测试

 

BLOCK 的测试—为表A加锁: (查询窗口A)

 

BEGIN TRAN    UPDATE A SET [ITEM] = RIGHT(NEWID(), 4)    WHERE [ITEM] BETWEEN '9' AND 'A'--ROLLBACK TRAN  -- 不回滚事务,让锁一直保持

 

 

 

 

 

BLOCK 的测试—测试查询方法A:(查询窗口B)

 

-- run query windows 2DECLARE @a intSET @a = 1IF @a = 0    SELECT [TranNumber] FROM A    WHERE [ITEM] < 'A'ELSE IF @a = 1    SELECT [ItemNumber] FROM B    WHERE [ItemNumber] < 'A'

 

 

BLOCK 的测试—测试查询方法B(查询窗口C)

 

-- run query windows 3DECLARE @a intSET @a = 1 SELECT [ITEM] FROM AWHERE @a = 0    AND [ITEM] < 'A'UNION ALLSELECT [ItemNumber] FROM BWHERE @a = 1    AND [ItemNumber] < 'A'

 

 

 

 

 

结果:

 

可以看到,查询窗口B中的查询会及时地完成,而查询窗口C的查询会一直等待,你可以通过执行存储过程 sp_who2,查看当前的BLOCK状况来确定查询窗口C的查询是否被查询窗口A的查询BLOCK住。

 

 

 

最后结论:

 

不要使用查询方法B,它看起来很不错,实际的结果即则是会增加被BLOCK的机会。