导入数据,观察数据,操作数据,可视化展示,关闭数据
data<-read.csv("xx.csv",header=1)#第一行是header,不是值
在读取数据时候,较有用的参数还有stringsasfactor=Fasle,这样就不会把所有的字符型变量转换成Factor因子。因子是不能用与字符串操作的,如分割字符串strsplit()
head(data) #观察数据
rownames(data)=data$memberid #把meberid列作为每行的索引key
R 对$,和[]引用方式是不同的, 方括号内逗号前指行,逗号后指列
列名,index索引一个意思
取列:
d$列名
d[,列名]
不建议d[[第几列]]
数据框d按第三列height列排序。列名是height
d[order(d$height),] 或
d[order(d[,3]),]
d[order(d[,3])][,c(1,3,6)] #数据框按第三列排序后,只列出1,3,6列
R 选择某写行观测值组成子数据框,这行的在某列值是95
d[d$value="95",]
操作列的时候建议加上,drop=False 防止字符串转为因子
取前两列d[1:2]
取第三行,5、6列 d[3:3,5:6]
取特定id的某列值 data["20211105","paymoney"]
取paymoney最大的行data[which.max(data$paymoney),]
最小的 which.min
取行:
d[1:2,]前两行
按行索引key取行data["20211105",]
取多行
data[c("20211105","20211104"),]