拓端tecdat：R语言估计多元标记的潜过程混合效应模型（LCMM）分析心理测试的认知过程

zoukankan html css js c++ java

拓端tecdat：R语言估计多元标记的潜过程混合效应模型（LCMM）分析心理测试的认知过程
原文链接：http://tecdat.cn/?p=24172

原文出处：拓端数据部落公众号



背景和定义

每个动态现象都可以用一个潜过程（Λ(t)）来表征，这个潜过程在连续的时间t中演化。有时，这个潜过程是通过几个标志来衡量的，因此潜过程是它们的共同因素。

多元标记的潜过程混合模型

Proust-Lima 等人引入了潜在过程混合模型。(2006 - A Nonlinear Model with Latent Process for Cognitive Evolution Using Multivariate Longitudinal Data - Proust - 2006 - Biometrics - Wiley Online Library 和 2013 - Analysis of multivariate mixed longitudinal data: A flexible latent process approach - Proust‐Lima - 2013 - British Journal of Mathematical and Statistical Psychology - Wiley Online Library ).

使用线性混合模型根据时间对定义为潜过程的感兴趣量进行建模：

其中：
- X(t) 和 Z(t) 是协变量的向量（Z(t) 包含在 X(t) 中；
- β是固定效应（即总体平均效应）；
- ui 是随机效应（即个体效应）；它们根据具有协方差矩阵 B 的零均值多元正态分布进行分布；
- (wi(t)) 是一个高斯过程。
根据时间和协变量的 Λ(t) 结构模型与单变量情况完全相同。

现在，我们不再定义一个观察方程，而是定义 K 个不同标记的 K 个观察方程，其中 Yijk是对主体 i、标记 k 和场合 j 的观察。在单变量情况下，可以通过定义特定于标记的链接函数 Hk 来处理几种类型的标记。特定于标记的观察方程还可能包括协变量上的一些对比 γk 以及标记和主体特定的随机截距：

其中：
- αik~N(0,σ2k)
- Xcijk协变量向量
- γk 是对比（k 上的总和等于 0）
- tijk 对象 i、标记 k 和场合 j 的测量时间；
- ϵijk一个独立的高斯误差，均值为 0，方差为 σ2ϵkσϵk2；
- Hk将潜过程转换为标记 k 的尺度和度量的链接函数（由 ηk 参数化）。
目前只考虑连续链接函数。这些与单变量情况（在 lcmm 中）相同。H−1 是一组递增单调函数的参数族：
- 线性变换：这简化为线性混合模型（2 个参数）
- Beta 累积分布族重新调整（4 个参数）
- 具有 m 个节点的二次 I 样条的基（m+2 个参数）
可识别性

与任何潜在变量模型一样，必须定义潜在变量的度量。这里第一个随机效应 ui的方差设置为 1，平均截距（在 β 中）设置为 0。

认知过程示例

在这个例子中，当认知被定义为三种心理测试的共同因素时，我们研究了认知随时间变化的轨迹：MMSE、BVRT和IST。这里的时间尺度是进入队列后的年数，轨迹被假定为时间上的二次方（在个人和人群层面），模型被调整为进入时的年龄。为了进一步研究性别的影响，包括对共同因素的平均效应和对每个标志的差异效应（对比）（在这个例子中不与时间相互作用）。

模型考虑：

其中：

和 , 是布朗过程，对于 k = 1,2,3： , 和

不同链接函数的估计

我们首先创建变量标准化，避免数值问题：
4. tie <- (ae - ag_it)/10
6. ag75 <- (ae_it - 75)/10
线性链接函数

默认情况下，所有链接函数都设置为线性：
1. mlmm( ubc'ID', dt = pud, radom = T, cr =B(tme))
非线性链接函数

根据数据的性质，可能需要一些非线性链接函数。例如，这里的 MMSE 是高度偏斜的：
1. hist(MMSE)
在单变量情况下，可以考虑 Beta CDF 或样条。链接函数族可以对所有标记都相同（即使参数不同）：
4. # 以Beta为例
5. mlmm( lnk = 'beta')
或者可以不同地选择链接函数。例如，
4. # 样条曲线中不同数量的结点
6. mlmm( lik = c('eta','3-uan-spes','3-antpln'))
修复一些转换参数

请注意，样条变换有时可能涉及非常接近 0 的参数，从而导致无法收敛（因为参数位于参数空间的边界）。这经常发生在 MMSE 中。例如，在下面的示例中，由于 MMSE 变换的第三个参数低于 10e-4，因此不容易达到收敛。
4. # 样条曲线
6. mlmm( axe=50, ink = c('3asin'))
通过使用 fix 选项修复此参数，可以轻松解决此问题。为此，可以从估计向量（此处为第 21 个参数）中识别参数的位置：
1. best
并且可以根据这些估计值和新固定的参数重新拟合模型：
4. # 样条曲线
6. mult(B=mp$best)
有了这个约束，模型就可以正确收敛。

模型比较

mult对象是多元潜在过程混合模型，它们假设潜过程的轨迹完全相同，但链接函数不同。在单变量情况下，可以使用信息标准来比较模型。该 summary 给我们这样的信息。
4. sumrtbe(ml)
涉及 Beta 变换和样条变换的模型在 AIC 方面似乎比显示偏离正态性的线性变换要好得多。

可以在模型之间绘制和比较转换：
4. par(mrow=c(1,1))
7. plot(llnes2, col = c(ol[2],ol[3]ol4]), ld =1,ly=4)
除了线性变换，所有的估计变换都非常接近。

后拟合输出

估计的链接函数：

链接函数的置信区间可以通过蒙特卡罗方法获得：
1. predict(ml_btapl)
3. plt(Cl)
概括

该模型的摘要包括收敛性、拟合优度标准和估计参数。
```
summary
```
从估计结果来看，基础认知随着时间的推移有一个二次方的轨迹，基线时年龄较大的受试者的认知水平系统地较低。根据性别没有差异。然而，性别对心理测试有明显的差异性影响（P=0.0003），男性的BVRT系统性较高，女性的IST水平较高。

方差解释

对于多元数据，潜在过程是不同标记的共同潜在因素。因此，我们可以计算解释潜在过程的每个标记的残差方差。解释的这种方差取决于协变量并在特定时间计算。
4. VarE(tbsp,dtafme(tme=0))
例如，公因子解释了 42% 的 MMSE 残差变化，而它解释了时间 0 时 26% 的 BVRT 残差变化。

标记的预测轨迹图

可以根据协变量分布计算标记的预测轨迹，然后绘制。
1. predct(btapl,nwdta=dtew,va.tim='ime')
4. plt(prec_we, ld=c(1)
拟合优度：残差图

与任何混合模型一样，我们希望特定主题的残差（右下图）是高斯分布的。
4. plt(mlep, 0.8)
拟合优度：预测与观察的关系图

可以根据时间绘制平均预测和观察结果。请注意，预测和观察是在潜过程的范围内（观察被转换为估计的链接函数）：
3. plot(beal, whch="fit", time="ti")
最受欢迎的见解

1.基于R语言的lmer混合线性回归模型

2.R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）

3.R语言线性混合效应模型实战案例

4.R语言线性混合效应模型实战案例2

5.R语言线性混合效应模型实战案例

6.线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样

7.R语言LME4混合效应模型研究教师的受欢迎程度

8.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

9.使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM
▍关注我们【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接：http://y0.cn/teradat ▍联系邮箱：3025393450@qq.com
查看全文

相关阅读:
jquery插件课程1 幻灯片、城市选择、日期时间选择、拖放、方向拖动插件
 博客园随笔如何自动生成目录（原理：页脚js函数且执行）
JAVA web四个属性的范围汇总
 关于继承modelDriven接口action的ajax来电参数
 Objective-C基调（4）Category
Easyui使用记录
 jQuery地图热点效应-后在弹出的提示鼠标层信息
 跨境移动互联网的魅力演绎，hao123无论成就下一个条目？
启示—地点IT高管20在职场心脏经（读书笔记6）
C# 获得Excel工作簿Sheet页面(工作表)集合的名称