1.消除重复 - DISTINCT
SQL语句中默认的是,重复的元祖可以多次的显示。如果希望消除重复,需要DISTINCT关键字。
注:消除重复需要排序,所以代价高。在需要高效率时要谨慎。
SELECT DISTINCT name FROM MovieExec, Movies, StarsIn WHERE cert# = producerC# AND title = movieTitle AND year = movieYear AND starName = 'Harrison Ford'
2.SQL中允许重复-ALL
SQL中的并、交、差默认不产生重复,像集合一样操作。(Mysql不支持,下面的语句就是记录一下)
如果希望保留重复,需要ALL关键字。
(SELECT title, year FROM Movies) UNION ALL (SELECT movieTitle AS title, moviesYear AS year FROM StarsIn);
R INTERSECT ALL S R EXCEPT ALL S
3.聚集
聚集:是指把关系中的某一列数据进行统计输出。
COUNT(*):统计关系中的元组个数
COUNT():统计括号中的元组个数
SUM(): 统计括号中那一列的和
AVG(): 平均值
MIN(): 最小值
MAX(): 最大值
注意:在计算的时候NULL都被忽略
SELECT AVG(netWorth) FROM MovieExec;
4.分组-GROUP BY
分组:把关系,按照某一个属性分组,即该属性值相同的分为一组。
如果使用分组,则聚集操作符是对每一个分组做聚集
SELECT studioName, SUM(length) FROM Movies GROUP BY studioName;
分组后,每一个组的studioName只出现1次。下面两个语句等效:
SELECT studioName FROM Movies GROUP BY studioName;
SELECT DISTINCT studioName;
5.对分组结果性质做筛选-HAVING
是在分组的基础上使用的,HAVING中的聚集是对当前的分组做的。
SELECT name, SUM(length) FROM MovieExec, Movies WHERE producerC# = cert# GROUP BY name HAVING MIN(year) < 1930;
6.SQL中子句顺序
SELECT, FROM, WHERE, GROUP BY, HAVING, ORDER BY
只有SELECT, FROM是必须的, 剩下的必须按上面的顺序出现。