zoukankan      html  css  js  c++  java
  • 拓端tecdat:R语言估计多元标记的潜过程混合效应模型(LCMM)分析心理测试的认知过程

    原文链接:http://tecdat.cn/?p=24172

    原文出处:拓端数据部落公众号

    背景和定义

    每个动态现象都可以用一个潜过程(Λ(t))来表征,这个潜过程在连续的时间t中演化。有时,这个潜过程是通过几个标志来衡量的,因此潜过程是它们的共同因素。

    多元标记的潜过程混合模型

    Proust-Lima 等人引入了潜在过程混合模型。(2006 - A Nonlinear Model with Latent Process for Cognitive Evolution Using Multivariate Longitudinal Data - Proust - 2006 - Biometrics - Wiley Online Library 和 2013 - Analysis of multivariate mixed longitudinal data: A flexible latent process approach - Proust‐Lima - 2013 - British Journal of Mathematical and Statistical Psychology - Wiley Online Library ).

    使用线性混合模型根据时间对定义为潜过程的感兴趣量进行建模:

    其中:

    • X(t) 和 Z(t) 是协变量的向量(Z(t) 包含在 X(t) 中;
    • β是固定效应(即总体平均效应);
    • ui 是随机效应(即个体效应);它们根据具有协方差矩阵 B 的零均值多元正态分布进行分布;
    • (wi(t)) 是一个高斯过程。

    根据时间和协变量的 Λ(t) 结构模型与单变量情况完全相同。

    现在,我们不再定义一个观察方程,而是定义 K 个不同标记的 K 个观察方程,其中 Yijk是对主体 i、标记 k 和场合 j 的观察。在单变量情况下,可以通过定义特定于标记的链接函数 Hk 来处理几种类型的标记。特定于标记的观察方程还可能包括协变量上的一些对比 γk 以及标记和主体特定的随机截距:


     

    其中:

    • αik~N(0,σ2k)
    • Xcijk协变量向量
    • γk 是对比(k 上的总和等于 0)
    • tijk 对象 i、标记 k 和场合 j 的测量时间;
    • ϵijk一个独立的高斯误差,均值为 0,方差为 σ2ϵkσϵk2;
    • Hk将潜过程转换为标记 k 的尺度和度量的链接函数(由 ηk 参数化)。

    目前只考虑连续链接函数。这些与单变量情况(在 lcmm 中)相同。H−1 是一组递增单调函数的参数族:

    • 线性变换:这简化为线性混合模型(2 个参数)
    • Beta 累积分布族重新调整(4 个参数)
    • 具有 m 个节点的二次 I 样条的基(m+2 个参数)

    可识别性

    与任何潜在变量模型一样,必须定义潜在变量的度量。这里第一个随机效应 ui的方差设置为 1,平均截距(在 β 中)设置为 0。

    认知过程示例

    在这个例子中,当认知被定义为三种心理测试的共同因素时,我们研究了认知随时间变化的轨迹:MMSE、BVRT和IST。这里的时间尺度是进入队列后的年数,轨迹被假定为时间上的二次方(在个人和人群层面),模型被调整为进入时的年龄。为了进一步研究性别的影响,包括对共同因素的平均效应和对每个标志的差异效应(对比)(在这个例子中不与时间相互作用)。

    模型考虑:

    其中:

    和  是布朗过程,  对于 k = 1,2,3:  和 

    不同链接函数的估计

    我们首先创建变量标准化, 避免数值问题:

    1.  
    2.  
       
    3.  
       
    4.  
      tie <- (ae - ag_it)/10
    5.  
       
    6.  
      ag75 <- (ae_it - 75)/10
    7.  
       
    8.  
       
    9.  

    线性链接函数

    默认情况下,所有链接函数都设置为线性:

    1.  
      mlmm( ubc'ID', dt = pud, radom = T, cr =B(tme))
    2.  
       
    3.  
       
    4.  

    非线性链接函数

    根据数据的性质,可能需要一些非线性链接函数。例如,这里的 MMSE 是高度偏斜的:

    1.  
      hist(MMSE)
    2.  
       
    3.  
       
    4.  

    在单变量情况下,可以考虑 Beta CDF 或样条。链接函数族可以对所有标记都相同(即使参数不同):

    1.  
    2.  
       
    3.  
       
    4.  
      # 以Beta为例
    5.  
      mlmm( lnk = 'beta')
    6.  
       
    7.  
       
    8.  

    或者可以不同地选择链接函数。例如,

    1.  
    2.  
       
    3.  
       
    4.  
      # 样条曲线中不同数量的结点
    5.  
       
    6.  
      mlmm( lik = c('eta','3-uan-spes','3-antpln'))
    7.  
       
    8.  
       
    9.  

    修复一些转换参数

    请注意,样条变换有时可能涉及非常接近 0 的参数,从而导致无法收敛(因为参数位于参数空间的边界)。这经常发生在 MMSE 中。例如,在下面的示例中,由于 MMSE 变换的第三个参数低于 10e-4,因此不容易达到收敛。

    1.  
    2.  
       
    3.  
       
    4.  
      # 样条曲线
    5.  
       
    6.  
      mlmm( axe=50, ink = c('3asin'))
    7.  
       
    8.  
       
    9.  

    通过使用 fix 选项修复此参数,可以轻松解决此问题。为此,可以从估计向量(此处为第 21 个参数)中识别参数的位置: 

    1.  
      best
    2.  
       

    并且可以根据这些估计值和新固定的参数重新拟合模型:

    1.  
    2.  
       
    3.  
       
    4.  
      # 样条曲线
    5.  
       
    6.  
      mult(B=mp$best)
    7.  
       
    8.  
       
    9.  

    有了这个约束,模型就可以正确收敛。

    模型比较

    mult对象是多元潜在过程混合模型,它们假设潜过程的轨迹完全相同,但链接函数不同。在单变量情况下,可以使用信息标准来比较模型。该 summary 给我们这样的信息。

    1.  
    2.  
       
    3.  
       
    4.  
      sumrtbe(ml)
    5.  
       
    6.  
       
    7.  
       
    8.  

    涉及 Beta 变换和样条变换的模型在 AIC 方面似乎比显示偏离正态性的线性变换要好得多。

    可以在模型之间绘制和比较转换:

    1.  
    2.  
       
    3.  
       
    4.  
      par(mrow=c(1,1))
    5.  
       
    6.  
       
    7.  
      plot(llnes2, col = c(ol[2],ol[3]ol4]), ld =1,ly=4)

    除了线性变换,所有的估计变换都非常接近。

    后拟合输出

    估计的链接函数:

    链接函数的置信区间可以通过蒙特卡罗方法获得:

    1.  
      predict(ml_btapl)
    2.  
       
    3.  
      plt(Cl)
    4.  
       
    5.  
       
    6.  

    概括

    该模型的摘要包括收敛性、拟合优度标准和估计参数。

    summary

     

    从估计结果来看,基础认知随着时间的推移有一个二次方的轨迹,基线时年龄较大的受试者的认知水平系统地较低。根据性别没有差异。然而,性别对心理测试有明显的差异性影响(P=0.0003),男性的BVRT系统性较高,女性的IST水平较高。

    方差解释

    对于多元数据,潜在过程是不同标记的共同潜在因素。因此,我们可以计算解释潜在过程的每个标记的残差方差。解释的这种方差取决于协变量并在特定时间计算。

    1.  
    2.  
       
    3.  
       
    4.  
      VarE(tbsp,dtafme(tme=0))
    5.  
       
    6.  
       
    7.  

    例如,公因子解释了 42% 的 MMSE 残差变化,而它解释了时间 0 时 26% 的 BVRT 残差变化。

    标记的预测轨迹图

    可以根据协变量分布计算标记的预测轨迹,然后绘制。

    1.  
      predct(btapl,nwdta=dtew,va.tim='ime')
    2.  
       
    3.  
       
    4.  
      plt(prec_we, ld=c(1)

    拟合优度:残差图

    与任何混合模型一样,我们希望特定主题的残差(右下图)是高斯分布的。

    1.  
    2.  
       
    3.  
       
    4.  
      plt(mlep, 0.8)
    5.  
       
    6.  
       
    7.  

    拟合优度:预测与观察的关系图

    可以根据时间绘制平均预测和观察结果。请注意,预测和观察是在潜过程的范围内(观察被转换为估计的链接函数): 

    1.  
       
    2.  
       
    3.  
      plot(beal, whch="fit", time="ti") 


    最受欢迎的见解

    1.基于R语言的lmer混合线性回归模型

    2.R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

    3.R语言线性混合效应模型实战案例

    4.R语言线性混合效应模型实战案例2

    5.R语言线性混合效应模型实战案例

    6.线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样

    7.R语言LME4混合效应模型研究教师的受欢迎程度

    8.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

    9.使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

    ▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接:http://y0.cn/teradat ▍联系邮箱:3025393450@qq.com
  • 相关阅读:
    /、./和../的区别
    【Java基础】-- FileUtils工具类常用方法
    【数据库】-- MySQL中比like更高效的三个写法
    【Java框架】-- SpringBoot大文件RestTemplate下载解决方案
    记一次gitlab代码仓清空还原复盘
    聊聊如何实现一个带有拦截器功能的SPI
    聊聊如何实现一个支持键值对的SPI
    类实例对象的class类型却不属于该类,何解?
    exe打包成安装文件(界面美观)
    linux系统软件启动sh脚本
  • 原文地址:https://www.cnblogs.com/tecdat/p/15636193.html
Copyright © 2011-2022 走看看