原文链接:http://tecdat.cn/?p=3060
介绍
在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关,这表明需要相关数据模型。由于用户,分析在统计上具有挑战性
- 处理两个摘要统计,
- 必须考虑敏感性和特异性之间的相关性,
- 必须考虑到研究中的敏感性和特异性的异质性
- 应该允许纳入协变量。
本教程介绍并演示了用于诊断准确性研究的荟萃分析的分层混合模型。在层次结构的第一级中,给定每个研究的灵敏度和特异性,两个二项分布用于分别描述患病和健康个体中真阳性和真阳性数的变化。在第二级,我们使用二元分布模拟未观察到的敏感性和特异性。虽然使用了分层模型,但荟萃分析的重点在于研究中的汇总平均值,而在给定的研究估算中很少。
使用来自两个先前发布的荟萃分析的数据集来演示这些方法:
- 尿液中端粒酶的诊断准确性作为诊断原发性膀胱癌的肿瘤标志物,因为它是一个有问题的数据集,其相关参数估计为-1并且没有协变量而引起收敛问题(Glas et al.2003)
- 比较人乳头瘤病毒检测(使用HC2检测)的敏感性和特异性与重复细胞学检查对具有轻微细胞学宫颈病变的女性进行分类,以检测潜在的宫颈癌前病变(Arbyn等,2013)。第二个数据集用于证明具有一个协变量的元回归,该协变量可以自然地扩展到包括几个协变量。
荟萃Meta 分析的统计方法
推理框架和软件
在贝叶斯框架内,分析师基于观察到的数据更新参数的先前意见/信息,而在频率框架中,分析师调查来自特定人群的假设重复样本中的参数估计的行为。由于其灵活性和MCMC模拟的使用,复杂建模通常可以在贝叶斯框架内更容易地实现。通过操纵先验分布,贝叶斯推断可以规避可识别性问题,而没有先验分布的频率推理中的数值逼近算法可能会因识别性问题而陷入困境。然而,贝叶斯方法通常需要统计专业知识和耐心,因为MCMC模拟是计算密集型的。相反,最频繁的方法已被包含在标准“程序”中,这些程序需要较少的统计知识和编程技能。此外,频率论方法通过最大似然估计(MLE)进行优化,与MCMC模拟相比,其具有更短的运行时间。
JAGS (Plummer等人2003)是Stan的另一种可扩展的通用采样引擎。扩展JAGS
需要知道C++
组装动态链接库(DLL)模块。根据经验,配置和构建模块是一项艰巨而繁琐的任务,尤其是在Windows操作系统中。上述缺点加上这样的事实,Stan
即使从较差的初始值开始,往往会以较少的迭代收敛,而不是JAGS
使我们更喜欢Stan
MCMC采样引擎。
该包提供了适合二元β二项分布的函数,这些分布构造为前面讨论的两个β边际分布和copula密度的乘积。该软件包还为具有分类协变量或仅具有截距的模型提供森林图。给定选择的copula函数,由cdtamodel
返回cdtamodel
对象的函数组合β二项分布。主函数fit
取cdtamodel
对象和适合的模型给定的数据集,并返回一个cdtafit
为哪个对象print
,summary
并plot
提供了用于方法。
模型诊断
为了评估链的模型收敛,混合和平稳性,有必要检查潜在的比例缩减因子,有效样本大小(ESS),MCMC误差和参数的跟踪图。当所有链达到目标后验分布时,估计后验方差接近于内链方差,使得两者的比率接近1,表明链是稳定,适当混合,可能已达到目标分布。一个大的R^R^[RR^R^[RR^R^表示混合不良,需要更多迭代。有效的样本大小表示实际上有关某个参数的信息量。当样本自动相关时,预期参数后验分布的信息少于样本独立时的信息。接近总预热后迭代的ESS表明链的自相关性和混合性较好。具有较高ESS的模拟具有较低的标准误差和较稳定的估计。由于模拟了后验分布,因此近似值有可能偏离一定量; 蒙特卡洛(MCMC)错误。MCMC错误接近0表示一个可能已达到目标分布。
模型比较和选择
Watanabe-Alkaike信息准则(WAIC)(Watanabe 2010)是一种最近的模型比较工具,用于测量拟合模型在贝叶斯框架中的预测精度,将用于比较模型。WAIC可以被视为对Deviance Information Criterion(DIC)的改进,尽管流行,但它已经存在一些问题(Plummer 2008)。WAIC是一个完全贝叶斯工具,非常接近贝叶斯交叉验证,对重新参数化不变,可用于简单以及分层和混合模型。
数据集
端粒酶数据
(Glas等,2003)系统地回顾了细胞学和其他标志物(包括端粒酶)对膀胱癌初步诊断的敏感性和特异性。他们在整个研究中对logit转换的灵敏度和特异性值进行了二元正态分布,从而允许研究之间的异质性。从包括10项研究,他们报告说,端粒酶有敏感性和特异性0.75 [0.66, 0.74]
,并0.86 [0.71, 0.94]
分别。他们得出结论,端粒酶不够灵敏,不宜推荐用于日常使用。该数据集在包和以下命令中可用
将数据加载到R环境中并生成以下输出
## ID TP TN FN FP
## 1 1 25 25 8 1
## 2 2 17 11 4 3
## 3 3 88 31 16 16
## 4 4 16 80 10 3
## 5 5 40 137 17 1
## 6 6 38 24 9 6
## 7 7 23 12 19 0
## 8 8 27 18 6 2
## 9 9 14 29 3 3
## 10 10 37 7 7 22
ID
是研究的标识符,DIS
是患病的数量,TP
是真阳性NonDis
的数量,是健康TN
的数量,是真阴性的数量。
ASCUS分类数据
(Arbyn等人,2013年)对人乳头瘤病毒检测的准确性进行了Cochrane评价,并重复细胞学分析,对宫颈涂片进行模棱两可的宫颈涂片检查以诊断宫颈癌前病变。他们SAS
使用BRMA模型进行METADAS
了10项研究,其中使用了两种测试。他们报道的绝对灵敏度0.909 [0.857, 0.944]
和0.715 [0.629, 0.788]
用于HC2和重复细胞学分别。的特异性0.607 [0.539, 0.68]
和0.684 [0.599, 0.758]
分别为HC2和重复细胞学检查。这些数据用于演示如何在元回归设置中扩展仅拦截模型。此数据集也可在包和以下命令中使用
将数据加载到R环境中并生成以下输出
## Test StudyID TP FP TN FN
## 1 RepC Andersson 2005 6 14 28 4
## 2 RepC Bergeron 2000 8 28 71 4
## 3 RepC Del Mistro 2010 20 191 483 7
## 4 RepC Kulasingam 2002 20 74 170 6
## 5 RepC Lytwyn 2000 4 20 26 2
## 6 RepC Manos 1999 48 324 570 15
## 7 RepC Monsonego 2008 10 18 168 15
## 8 RepC Morin 2001 14 126 214 5
## 9 RepC Silverloo 2009 24 43 105 10
## 10 RepC Solomon 2001 227 1132 914 40
## 11 HC2 Andersson 2005 6 17 25 4
## 12 HC2 Bergeron 2000 10 38 61 2
## 13 HC2 Del Mistro 2010 27 154 566 2
## 14 HC2 Kulasingam 2002 23 115 129 3
## 15 HC2 Lytwyn 2000 4 19 33 1
## 16 HC2 Manos 1999 58 326 582 7
## 17 HC2 Monsonego 2008 22 110 72 2
## 18 HC2 Morin 2001 17 88 253 2
## 19 HC2 Silverloo 2009 34 65 81 2
## 20 HC2 Solomon 2001 256 1050 984 11
Test
是一个解释变量,显示分类测试的类型,StudyID
是研究标识符,TP
是真阳性FP
的数量,TN
是误报的数量,FN
是真阴性的数量,是假阴性的数量。
截距模型
该CopulaDTA
包具有五种不同的相关结构,导致五种不同的二变量β二项分布适合数据。相关结构由指示指定copula ="gauss"
或"fgm"
或"c90"
或"270"
或"frank"
在cdtamodel
功能。
telomerase
使用以下代码将高斯copula双变量β二项分布拟合到数据
默认情况下,chains = 3
并且cores = 3
,不需要,除非另有说明。从上面的代码中,28000
从每个3
链中1000
抽取样本,丢弃第一个样本,然后每个30
(^ {th} )绘制保持,使得每个链具有900个预热后抽取,使得总共2700个帖子 - 温暖的吸引力。种子值seed = 3
指定随机数生成器以允许结果的再现性,并cores = 3
允许通过使用3
核来并行处理链,每个链一个核。它们没有指定初始值,在这种情况下,程序随机生成满足参数约束的随机值。
下面的迹线图显示了链和收敛的令人满意的混合。
接下来,获得如下的模型概要估计
## Posterior marginal mean and median sensitivity and specificity
## with 95% credible intervals
##
## Parameter Mean Lower Median Upper n_eff Rhat
## MUse[1] Sensitivity 0.756762 6.904e-01 0.756036 0.81658 1196.9 1.001
## MUsp[1] Specificity 0.798289 6.171e-01 0.813517 0.90640 704.4 1.004
## ktau[1] Correlation -0.820176 -9.861e-01 -0.876343 -0.33334 269.2 1.015
## Varse[1] Var(Sens) 0.006198 8.321e-06 0.005047 0.01947 165.7 1.007
## Varsp[1] Var(Spec) 0.048111 1.357e-02 0.041060 0.12204 169.5 1.007
##
##
## Model characteristics
##
## Copula function: gauss, sampling algorithm: NUTS(diag_e)
##
## Formula(1): MUse ~ 1
## Formula(2): MUsp ~ 1
## Formula(3): Omega ~ 1
## 3 chain(s)each with iter=28000; warm-up=1000; thin=30.
## post-warmup draws per chain=900;total post-warmup draws=2700.
##
## Predictive accuracy of the model
##
## Log point-wise predictive density (LPPD): -38.0607
## Effective number of parameters: 7.5807
## Watanabe-Akaike information Criterion (WAIC): 91.2828
从上面的输出,n_eff
并且Rhat
都确认与小的自相关链的适当的混合。所述元分析灵敏度MUse[1]
和特异性MUsp[1]
是0.7568 [0.6904, 0.8166]
和0.7983 [0.6171, 0.9064]
分别。灵敏度和特异性之间的研究间差异分别为0.0062 [0, 0.0195]
和0.0048 [0.0136, 0.1220]
。Kendall在敏感性和特异性之间的tau相关性估计为-0.8202 [-0.9861, -0.3333]
。
以下命令生成一系列森林图。
## $G1
##
## $G2
##
## $G3
## Warning: Removed 2 rows containing missing values (geom_errorbar).
$G1
是研究特异性敏感性和特异性(品红色点)及其相应的95%确切置信区间(黑线)的图。$G2
是后验研究特定(蓝点)和边缘(蓝钻)敏感性和特异性及其相应的95%可信区间(黑线)的图。
$G3
是后验研究特定(蓝色星)和边缘(蓝色菱形)敏感性和特异性及其相应的95%可信区间(黑线)的图。还给出了研究特异性的灵敏度和特异性(品红点)及其相应的95%确切置信区间(粗灰线)。
如上图所示,后验研究特异性的敏感性和特异性不如“观察到的”研究特异性敏感性和特异性那么极端和可变。换句话说,随着研究以下列方式相互借用力量,总体平均敏感性和特异性存在“收缩”:后验研究特定的估计取决于全球估计,因此也取决于所有其他研究。
为了进行比较,目前推荐的型号; 使用普通边缘的BRMA也适用于数据,尽管它不是CopulaDTA
包的一部分。该模型首先在Stan
下面的代码中用建模语言表示,并R
作为字符串命名存储在环境中BRMA1
。
接下来,通过创建如下列表来准备数据
在data
块中,指定了数据集中变量的维度和名称,此处Ns
指示数据集中的研究数量。该parameters
块引入了待估计的未知参数。这些是etarho
; 表示Fisher氏变换的关联参数的形式的标量( RHO ) ,mul
;一个(2 倍1 )表示的灵敏度和特异性在分对数尺度的平均值为中心的考察,其中随机效应是矢量零,sigma
; a (2 times 1 )向量,表示研究标准偏差的敏感性和特异性对logit量表logitp
; a (Ns 次2 )第一列中研究特异性敏感性的一系列和第二列中特异性标度的特异性,和logitphat
; a (Ns 次2 )第一列预测灵敏度数组,第二列预测特异性logit量表。
在transformed parameters
块中进一步转换参数。这里p
是第一列中的(2 次Ns )灵敏度数组和第二列中反特性转换后的第二列中的特异性logitp
,并且phat
是第一列中预测灵敏度的(2 倍Ns )数组并且在logitphat
用于计算荟萃分析灵敏度和特异性的逆logit变换后的第二列中预测特异性。mu
是一个(2 次1 )向量,代表某个研究的灵敏度和特异性的平均值,随机效应等于0,MU
是一个(2 乘1 )载体包含荟萃分析的敏感性和特异性Sigma
; $ 2 ( times ) 2 $矩阵表示在logit量表上的灵敏度和特异性的方差 - 协变矩阵,rho
并且ktau
分别代表Pearson和Kendall的tau相关性的标量。在model
块中定义所有参数和数据似然的先前分布。最后,在generated quantities
块中,loglik
是计算WAIC所需的对数似然的((2Ns)次1 )向量。
接下来,stan
从rstan
包中调用函数将代码转换为C++
,编译代码并从后验分布中提取样本,如下所示
提取参数估计,并使用以下代码进一步检查链收敛和自相关
## Inference for Stan model: 61572683b29d52354783115614fab729.
## 3 chains, each with iter=5000; warmup=1000; thin=10;
## post-warmup draws per chain=400, total post-warmup draws=1200.
##
## mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
## MU[1] 0.7525 0.0018 0.0517 0.6323 0.7562 0.8415 796 0.9999
## MU[2] 0.7908 0.0034 0.1095 0.5273 0.8094 0.9539 1045 1.0008
## mu[1] 0.7668 0.0013 0.0388 0.6869 0.7688 0.8369 891 0.9990
## mu[2] 0.8937 0.0027 0.0753 0.6943 0.9115 0.9825 789 0.9992
## rho -0.9311 0.0070 0.1353 -0.9996 -0.9813 -0.5626 372 1.0077
## Sigma[1,1] 0.3376 0.0091 0.2918 0.0579 0.2554 0.9851 1026 1.0023
## Sigma[1,2] -1.2291 0.0272 0.8765 -3.4195 -1.0031 -0.2724 1040 0.9991
## Sigma[2,1] -1.2291 0.0272 0.8765 -3.4195 -1.0031 -0.2724 1040 0.9991
## Sigma[2,2] 5.6827 0.1282 4.1931 1.4720 4.6330 16.9031 1070 1.0002
##
## Samples were drawn using NUTS(diag_e) at Mon Oct 09 09:19:55 2017.
## For each parameter, n_eff is a crude measure of effective sample size,
## and Rhat is the potential scale reduction factor on split chains (at
## convergence, Rhat=1).
所述元分析灵敏度(MU[1]
)和特异性(MU[2]
)和95%可信区间是0.7525[0.6323, 0.8415]
和0.7908[0.5273, 0.9539]
分别。这与作者以两种方式发表的文章(0.75 [0.66,0.74]和0.86 [0.71,0.94])不同。作者将标准双变量正态分布拟合到logit转换的敏感性和特异性值,在研究中允许研究之间的异质性,并忽略了更高层次的分层模型。因此,作者必须使用0.5的连续性校正,因为第七项研究“观察”特异性等于1,这是分层模型中没有遇到的问题。其次,作者没有报告荟萃分析值,而是报告平均敏感性(mu[1]
)和特异性(mu[2]
)与随机效果等于零,这对我们来说是一个特别的,假设的研究0.7668[0.6869, 0.8369]
和0.8937[0.6943, 0.9825]
分别是媲美作者报道什么。之间的这种差异MU
,并mu
确实将与研究之间的差异增大而增大。这里,(MU[1]
)和(mu[1]
)是相似的,因为logit量表(Sigma[1,1]
)中灵敏度的研究间变异性很小0.333 [0.0579, 0.9851]
。由于logit量表中特定的研究之间的异质性()=,(MU[2]
)基本上小于mu[2]
(Sigma[2,2]
)5.6827 [1.4720, 16.9031]
。
下图显示除了Clayton copula模型之外,大多数拟合模型的链条混合效果令人满意,几乎没有自相关。
## Loading required package: lattice
## Loading required package: plyr
## This is loo version 1.1.0
## Warning: 6 (30.0%) p_waic estimates greater than 0.4.
## We recommend trying loo() instead.
## Model Parameter Mean Lower Median Upper n_eff
## 1 Gaussian Sensitivity 0.756762 6.904e-01 0.756036 8.166e-01 1196.857
## 2 Gaussian Specificity 0.798289 6.171e-01 0.813517 9.064e-01 704.379
## 3 Gaussian Correlation -0.820176 -9.861e-01 -0.876343 -3.333e-01 269.179
## 4 Gaussian Var(Sens) 0.006198 8.321e-06 0.005047 1.947e-02 165.705
## 5 Gaussian Var(Spec) 0.048111 1.357e-02 0.041060 1.220e-01 169.508
## 6 C90 Sensitivity 0.751379 6.913e-01 0.753546 8.098e-01 25.638
## 7 C90 Specificity 0.807051 6.549e-01 0.821119 9.069e-01 119.897
## 8 C90 Correlation -0.528340 -9.766e-01 -0.725178 -4.020e-18 4.111
## 9 C90 Var(Sens) 0.004885 3.400e-04 0.003297 1.955e-02 11.615
## 10 C90 Var(Spec) 0.045694 1.556e-02 0.038049 1.020e-01 137.149
## 11 C270 Sensitivity 0.757528 6.877e-01 0.761163 8.210e-01 273.236
## 12 C270 Specificity 0.803502 6.328e-01 0.811740 9.097e-01 1081.987
## 13 C270 Correlation -0.697493 -9.827e-01 -0.808717 -3.332e-06 40.012
## 14 C270 Var(Sens) 0.006662 2.667e-04 0.005293 2.027e-02 556.055
## 15 C270 Var(Spec) 0.044767 1.268e-02 0.037922 1.112e-01 1098.815
## 16 FGM Sensitivity 0.759407 6.891e-01 0.761931 8.174e-01 2475.208
## 17 FGM Specificity 0.802588 6.453e-01 0.812498 9.045e-01 2293.332
## 18 FGM Correlation -0.174538 -2.222e-01 -0.222221 2.222e-01 785.016
## 19 FGM Var(Sens) 0.005390 7.425e-07 0.004181 1.813e-02 1019.633
## 20 FGM Var(Spec) 0.041890 1.177e-02 0.036671 9.997e-02 2479.371
## 21 Frank Sensitivity 0.756683 6.855e-01 0.758340 8.152e-01 2686.631
## 22 Frank Specificity 0.808239 6.472e-01 0.818777 9.110e-01 1910.561
## 23 Frank Correlation -0.706819 -8.550e-01 -0.692019 1.000e+00 2700.000
## 24 Frank Var(Sens) 0.006678 5.896e-04 0.005280 2.140e-02 2699.766
## 25 Frank Var(Spec) 0.042067 1.201e-02 0.035908 1.039e-01 1937.653
## 26 BRMA Sensitivity 0.752531 6.323e-01 0.756181 8.415e-01 796.037
## 27 BRMA Specificity 0.790796 5.273e-01 0.809420 9.539e-01 1044.902
## 28 BRMA Correlation -0.822353 -9.824e-01 -0.876654 -3.804e-01 238.268
## 29 BRMA Var(lSens) 0.337556 5.792e-02 0.255387 9.851e-01 1025.609
## 30 BRMA Var(lSpec) 5.682692 1.472e+00 4.632967 1.690e+01 1070.481
## Rhat WAIC
## 1 1.0014 91.28
## 2 1.0044 91.28
## 3 1.0154 91.28
## 4 1.0072 91.28
## 5 1.0069 91.28
## 6 1.1047 91.40
## 7 1.0304 91.40
## 8 1.3707 91.40
## 9 1.1005 91.40
## 10 1.0311 91.40
## 11 1.0096 90.75
## 12 1.0001 90.75
## 13 1.0407 90.75
## 14 1.0024 90.75
## 15 0.9999 90.75
## 16 0.9998 97.37
## 17 0.9996 97.37
## 18 1.0070 97.37
## 19 1.0034 97.37
## 20 0.9999 97.37
## 21 0.9994 90.55
## 22 0.9997 90.55
## 23 NaN 90.55
## 24 0.9990 90.55
## 25 0.9992 90.55
## 26 0.9999 86.76
## 27 1.0008 86.76
## 28 1.0218 86.76
## 29 1.0023 86.76
## 30 1.0002 86.76
结果以图形方式呈现如下
模型比较
Table1
上面显示,BRMA模型和高斯copula双变量β估计的相关性更加极端,但与Frank的估计相当,(90 ^ { circ} ) - 和(270 ^ { circ} ) - 克莱顿copula。另一个极端是来自模型FGM copula双变量β的估计,这是由于FGM copula中关联参数的约束,其中值在| 2/9 |内。
在上图中g1
,尽管相关结构存在差异,但五个双变量β分布的边际平均灵敏度和特异性与95%可信区间的细微差异相当。
格拉斯等人。(2003)和Riley等人。(2007a)估计在频率论框架内,BRMA模型中的Pearson相关参数( rho )为-1。使用最大似然估计,Riley等。(2007b)表明,BRMA之间的研究间相关性通常估计为+/- 1。在没有估计困难的情况下,上表显示了Pearson估计的相关性-0.8224[-0.9824, -0.3804]
。这是因为贝叶斯方法不受样本量的影响,因此能够处理具有较少问题的小样本量的情况。
基本上,所有六个模型在第一级层次结构中是等价的,并且在指定“研究特异性”敏感性和特异性的先前分布方面不同。因此,模型应具有相同数量的参数,在这种情况下,比较日志预测密度是有意义的。在检查时,来自五个基于copula的模型的对数预测密度实际上是等效的(min=-38.77, max=-37.89
)但是参数的有效数量有点不同(min=7.25, max=9.92
)。BRMA具有6
有效参数,但具有较低的对数预测密度-43.4
。上表的最后一列表明尽管预测密度较低,但BRMA最适合基于WAIC的数据。
Meta回归
该ascus
数据集有Test
}作为协变量。使用协变量是有意义的,以研究其对敏感性和特异性(包括相关性)的联合分布的影响。以下代码将基于copula的二元beta二项分布拟合到数据ascus
数据。
下图显示了适用于ascus
数据的所有六个模型的迹线图,其中所有参数(包括相关参数(BRMA除外))都被建模为协变量的函数。除了基于Clayton copula的双变量β的情况外,存在适当的链混合和收敛。
下n\_eff
表中表示在对Gaussian',
FGM'和'Frank'模型除外的相关参数采样中的实质自相关。从基于copula的双变量β分布来看,很明显HC2和重复细胞学中的敏感性和特异性之间的相关性是不同的。
## Warning: 19 (47.5%) p_waic estimates greater than 0.4.
## We recommend trying loo() instead.
## Model Test Parameter Mean Lower Median Upper
## 9 Gaussian HC2 Correlation -0.43812 -0.9984 -6.959e-01 9.847e-01
## 10 Gaussian Repc Correlation -0.91991 -0.9997 -9.643e-01 -6.103e-01
## 23 C90 HC2 Correlation -0.06588 -0.7610 -1.039e-17 -7.624e-19
## 24 C90 Repc Correlation -0.85157 -0.9804 -9.120e-01 -4.906e-01
## 37 C270 HC2 Correlation -0.03038 -0.6452 -7.000e-18 -1.782e-18
## 38 C270 Repc Correlation -0.77847 -0.9757 -7.058e-01 -5.394e-01
## 51 FGM HC2 Correlation -0.07618 -0.2222 -2.215e-01 2.222e-01
## 52 FGM Repc Correlation -0.19819 -0.2222 -2.222e-01 1.894e-01
## 65 Frank HC2 Correlation -0.48806 -0.8140 -4.497e-01 1.000e+00
## 66 Frank Repc Correlation -0.73784 -0.8627 -7.275e-01 1.000e+00
## 81 BRMA Both Correlation -0.84808 -0.9839 -8.980e-01 -4.497e-01
## n_eff Rhat WAIC
## 9 154.238 1.0066 236.4
## 10 24.342 1.0542 236.4
## 23 30.089 1.0690 235.7
## 24 8.532 1.1128 235.7
## 37 76.410 1.0326 227.5
## 38 2.945 1.4613 227.5
## 51 2422.935 1.0007 245.1
## 52 2550.145 0.9997 245.1
## 65 2700.000 NaN 238.3
## 66 2700.000 NaN 238.3
## 81 102.983 1.0254 233.7
该Clayton90
模型具有最低的WAIC即使如图abover和在它们的踪影地块看到从后验分布采样很难n_eff
与Rhat
上表中。从后验采样的困难可能是信号过度参数化相关结构。因此,仅使用一个相关参数重新拟合模型并比较模型将是有趣的。已知WAIC在某些情况下会失败,这个例子表明,检查模型的拟合度和合理性是否充分是至关重要的,而不是盲目地依赖信息标准来选择最适合数据的标准。
从下面绘制的后验相对敏感性和特异性,所有收敛的模型通常认为重复细胞学比HC2敏感性低,而特异性没有显着损失。
讨论
基于Copula的型号提供了极大的灵活性和易用性,但它们的使用并非毫不谨慎。虽然本文中使用的copula具有吸引力,因为它们在数学上易于处理,但(Mikosch 2006)和(Genest and Remillard 2006)指出,从数据中估算copula可能很困难。此外,copula模型背后的概念稍微复杂一些,因此需要统计专业知识来理解和编程它们,因为它们尚未作为统计软件中的标准程序/程序。
在本文中,简要讨论了几种用于诊断准确性研究的荟萃分析的先进统计模型。演示了在灵活界面中使用该R
软件包CopulaDTA
,Stan
并展示了如何以方便的方式实现复杂模型。
在大多数实际情况中,边际均值结构是主要的利益,相关结构被视为麻烦,使得copula的选择不那么重要。尽管如此,适当的相关结构对于解释数据中的随机变化以及获得有效的基于模型的平均结构推断至关重要。
在评估荟萃分析的敏感性和特异性以及相关性时,模型之间存在一些差异。因此,有必要进一步研究以研究某些参数的影响,例如研究数量,样本量和联合分布的错误指定对荟萃分析的估计。
结论
提出的贝叶斯模型使用copula来构建二元β分布,提供了适当的边际和条件解释的估计,而不是典型的BRMA模型,该模型估计特定研究的敏感性和特异性,具有特定的随机效应值。此外,模型不具有与小样本大小或大型研究间方差估计困难,因为:我的研究间的差异不是恒定的,而是取决于底层装置和II贝叶斯方法较少受小样本大小的影响。
拟合模型通常认为平均特异性略低于Glas等人。(2003)报道并基于此我们得出结论,端粒酶不敏感且特异性不足以推荐用于日常使用。
在ASCUS分类数据中,基于拟合模型的结论与作者得出的结论一致:HC2比重复细胞学检查更敏感但更轻微,并且没有明显低于特异性巴氏涂片诊断宫颈癌前病变的女性。
虽然BRMA对于两个数据集都具有最低的WAIC,但我们仍然建议使用双变量β分布对灵敏度和特异性进行建模,因为它们可以轻松直接地提供元分析估计。