Distinct的作用是用于从指定集合中消除重复的元组,经常和count搭档工作,语法如下
COUNT( { [ ALL | DISTINCT ] expression ] | * } )
这时,可能会碰到如下情况,你想统计同时有多列字段重复的数目,你可能会立马想到如下方法:
selectcount( distinct col1 , col2 , col3 , .......) from table
但是,这样是不允许的,因为count是不能统计多个字段的,虽然distinct是可行的。
有种比较直接的方法就是把消除重复后在统计查询:
select count(*) from (select distinct col1 ,col2 , col3 from table)A
但是在有些复杂情况下,比如你的统计值可能还需要作为新的临时表的一列,而且这个新表可能还在做些其他复杂查询时候,这样就不是很方便了。
有种方法比较特别,就是把多个字段的当做一个字段去用于消除重复,比如把这个多个字段的字符串连接起来。如下:
selectcount(DISTINCT fcode+cast(fread_date as varchar(30))) from my_table
这种解决方案在某些情况还是挺方便的,虽然效率不高