大家大概都对如下信息图并不陌生,该图用100%堆积面积图的方式来表现不同时期不同国家人数所占的比例。这是一种很有意思的表达方式,而面积图也是很常用的数据图表,现在让我们一起来看看如何在R里用ggplot2和plot.area来制作一个面积图。
在制作图表之前,首先我们先创建一些随机示例数据。R代码如下:
-
1 # 创建随机数 2 set.seed(3)
3 # 创建时间序列(0-20的time step) 4 t.step<-seq(0,20)
5 # 创建十组变量名(从a到j) 6 grps<-letters[1:10]
7 # 创建一个由随机数组成的十组变量的时间序列 8 grp.dat<-runif(length(t.step)*length(grps),5,15)
9 # 为绘图而创建所需的dataframe 10 grp.dat<-matrix(grp.dat,nrow=length(t.step),ncol=length(grps)) 11 grp.dat<-data.frame(grp.dat,row.names=t.step)
数据结果如图所示:
接下来,我们用plot.area来绘制一个简易的面积图,代码如下:
-
1 source("https://gist.github.com/fawda123/6589541/raw/8de8b1f26c7904ad5b32d56ce0902e1d93b89420/plot_area.r") 2 plot.area(grp.dat)
效果如下:
而对于plot.area,有很多参数可以进行调整来得到不同效果的图,比如颜色,坐标名称,是否100%堆积等。具体参数设置可参考如下:
若我们调整颜色:
-
1 plot.area(grp.dat,col=c('red','lightgreen','purple'))
得到的效果如下:
接下来我们看看如何用ggplot2来绘制一个面积图。在绘图之前,首先我们需要转换我们的数据格式,需要将多个列汇总到一个变量列(variable)和一个数值列(value), 转置数据的代码如下:
-
1 p.dat<-data.frame(step=row.names(grp.dat),grp.dat,stringsAsFactors=F) 2 p.dat<-melt(p.dat,id='step') 3 p.dat$step<-as.numeric(p.dat$step)
接下来,我们需要导入ggplot2,以及绘制面积图,代码如下:
-
1 # 导入包 2 require(ggplot2) 3 require(reshape) 4 require(gridExtra) 6 # 绘制面积图 7 p<-ggplot(p.dat,aes(x=step,y=value)) 8 p1<-p + geom_area(aes(fill=variable))+ theme(legend.position="bottom") 9 p2<-p + geom_area(aes(fill=variable),position='fill')
我们来看一下p1和p2分别的效果:
当然,geom有更多好玩的应用,具体可以戳:http://docs.ggplot2.org/current/geom_area.html