初始数据类似:
蛋白质组数据虽不是严格的正态分布,但目前最常用的检验方法还是T检验(两组比较)和方差分析(多组比较)。这个话题值得深究,这里不展开。
主要是求多个蛋白的Pvalue值或FDR,用于差异筛选。
Pvalue <- c()
type<-factor(c(rep("S01CC",3),rep("S11SC",3),rep("S12CC",3),rep("S12SC",3)))
for(i in 1:nrow(exp)){
if(sum(exp[i,1:3])==0 && sum(exp[i,4:6])==0 && sum(exp[i,7:9])==0 && sum(exp[i,9:12])==0){
Pvalue[i] <- "NA"
}else{
y=aov(as.numeric(exp[i,1:12]) ~ type)
Pvalue[i]<-summary(y)[[1]][,5][1]
# Pvalue[i]<-summary(y)[[1]][,"Pr(>F)"][1]
}
}
FDR=p.adjust(Pvalue, "BH")
out<-cbind(exp,Pvalue,FDR)
write.csv(out,"anova_out.csv",row.names = T)