原文链接: http://tecdat.cn/?p=23697
原文出处:拓端数据部落公众号
我们使用R库mgcv,用广义加性模型(GAMs)对环境数据进行建模。mgcv是一个伟大的库,具有丰富的功能,但我们经常发现,默认的诊断图并不令人振奋。特别是偏残差图,功能很强,但不漂亮,残差几乎看不见。我们需要根据这些代码来制作自己的偏回归平滑图。
1) 基本的数据设置
我们正在使用这里讨论的数据集。我们使用的是国家发病率和死亡率空气污染研究(NMMAPS)的数据。我们将数据限制在1997-2000年。
data[date>as.Date("1996-12-31"),]
2) 简单的GAM模型--温度对臭氧
在这个例子中,我们保持模型的简单性--使用高斯数据,单一预测因子。我们对温度与臭氧进行建模,我们将输出默认的偏残差图。
-
-
# 模型 - 温度对臭氧的影响
-
plot(gam)
-
这个图可以改进?
3) 重新制作偏残差图
偏残差图(Partial Residual Plot)是多元回归中常用的诊断工具,特别是评估模型中在一个或另一个解释变量中是否包含非线性项。在多元回归y=β0+β1x1+…+βpxp+ε中,若欲反映其中变量Xj与因变量y之间的关系并用图形显示,其方法之一是用偏残差图。
在这里,我们加入平滑项、置信区间和偏残差。
-
-
#我们可以在多边形的顶部添加线条
-
qplot(temp, fit, type="n")+poly(c(temp, rev(temp)),
-
c(low95,rev(up95))# 对于置信度的灰色多边形
-
-
在最后一步,我们要加入偏残差本身。偏残差是平滑项的估计值+整个模型的残差。
-
-
#添加偏残差。
-
-
points(temp,partial.resids)
-
-
为便于参考,这里是完整模型的摘要。
模型 - 温度对臭氧的影响
最受欢迎的见解
3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)
6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现