使用DAX中的某些函数特别类似Calculate这种函数创建计算列时很容易出现一种错误,叫做检测到循环依赖关系,即:A circular dependency was detected。对于刚接触Dax语言的人来说,这个错误看着有点摸不到头脑,整个公式使用上似乎没有任何问题,怎么会出现这个错误呢?
要排查这个错误,先了解一下循环依赖关系指的是什么。如下图所示,循环依赖关系简单的可以理解为,A由B得出,而B又由A有关联关系。这就导致出现了一个循环的圈圈,你中有我,我中有你,然后,然后就是你和我都分不清楚了。
在Dax中,循环依赖错误在创建计算列时比较容易出现,有的时候排查起来也可能很困难。由浅入深,这个blog先介绍一下单张表中是如何出现循环依赖错误的。
先看下面这个最简单的产品销售报表,原始列有产品名(Product),单价(Unit Price),成本(Cost),以及销售量(Sales Volume)。:
可以创建一个新的计算列(column)Profit,用来计算每个产品的收益。
此时,我们还可以进一部的算一下每个产品的收益率%Profit,也就是收益占产品单价的比重。
目前一切都看起来平淡无奇。如果我们脑洞开一下,既然有了收益率,那么收益率*产品单价是不是可以反过来推出产品收益呢?我们把原来的产品收益率计算公式从Unit Price - Cost改成%Profit*Unit Price,看一下Power BI的计算结果:
此时果不其然,有循环依赖关系的错误返回。这个理解起来很简单,因为%Profit是由Profit推出来的,而现在我们又打算让DAX用%Profit去推Profit,这显然行不通。
这个例子看起来非常low,因为实际操作中是不会有人回头去改Profit计算公式而造成循环依赖关系的。但是这个例子能说明一个很重要的问题,因为DAX中有一种很重要的概念叫上下文,我们在使用某些对上下文非常敏感的函数时,很有可能就无意中掉进了这个循环依赖错误圈套里面,即虽然表面上看不到明显的A引用B,B又引用A的关系,但是通过上下文这一作用,隐式的出现了A和B之间相互引用的错误。这一情况最容易出现在Calculate函数身上。
还是用这个Product Table做例子,我们用CALCULATE+ SUMX函数对产品A来计算Total Sales。
计算结果没有什么问题,看起来很完美。同理的,我们套用这一公式对产品A来计算Total Cost。然而,当我们敲回车准备拿计算结果时,悲剧发生了,一个循环依赖错误蹦了出来。并且提示我们这个错误跟之前刚刚创建的Total Sales有关系。
这个提示错误很崩溃,因为跟最开始Profit那个例子不一样,我们Total Sales和Total Cost里面用的列都是原数据,根本就不存在推算关系。怎么用原数据计算的Total Cost就和Total Sales产生循环依赖关系了呢?原因吗,就是出现在Calculate函数身上。
Calculate函数是一个重度上下文依赖函数,也就是说,当一个计算列中出现了Calculate函数后,你要特别小心,因为当前行中所有的数据都可能跟Calculate函数的结果产生关系。
在当前例子中,当只有Total Sales这个计算列时,与其有关联关系的是:
元素 | 依赖值 |
---|---|
SUMX | Unit Price,Sales Volume |
行: Product =A | Product=A,Unit Price=75,Cost=49,Sales Volumn=10000 |
而当创建了Total Cost这个计算列时,整个Product是A的这一行上下文发生了变化,又增加了一列。这样对于用重度上下文依赖关系的Calculate函数计算得出的Total Sales来讲,与其有关联关系的多了一个Total Cost。即
元素 | 依赖值 |
---|---|
SUMX | Unit Price,Sales Volume |
行: Product =A | Product=A,Unit Price=75,Cost=49,Sales Volumn=10000,Total Cost=? |
而同样的从Total Cost角度来看,从Product是A的这一行上下文关系中包含一个Total Sales=750,000值。这样就隐式的出现了一个循环依赖关系,即Total Sales依赖Total Cost,而Total Cost又依赖Total Sales。
元素 | 依赖值 |
---|---|
SUMX | Unit Price,Sales Volume |
行: Product =A | Product=A,Unit Price=75,Cost=49,Sales Volumn=10000,Total Sales=750,000 |
如何解决该问题呢?最简单直接的其实是尽量不要在计算列中使用Calculate函数。因为这个函数陷阱太多,容易把自己绕进去,Calculate与度量值其实更配哦。当然,如果要用也可以,尽量只用一个,多个的时候非常容易出现循环依赖错误。如果非要用多个呢?好吧,可以尝试CALCULATE+EXCEPTALL的组合来清理这种上下文关系。
当然,这只适合于比较简单的数据结构,如果是有多张表相互关联,要排查循环依赖错误就更加的麻烦。