zoukankan      html  css  js  c++  java
  • 控制混杂-有感

    在RCT中,为了控制混杂,我们收集样本时采用较为严格的入排标准,使受试者的基线(可能的混杂)尽量相近

    但是在真实世界研究中,往往事先无法控制这个因素,研究者们采用统计的方法,使得混杂得到控制。

    常用的方法有以下几种:

    1,分层分析

    2,多因素分析

    3,倾向性评分

    4,工具变量分析

    1,分层分析

    顾名思义,将样本按照混杂因素分层,比如吸烟(暴露)对肺癌(结局)的影响

    那么性别可能是一个混杂。所以,我们在计算OR、RR、HR或其他流行病学 指标/效应时,将样本分为两层

    男性,女性,分别计算OR,(当男OR与女OR接近时,此处不做讨论)使用(Mantel-Haenszel)法合并OR

    缺点:n个混杂,需要分2^n个层,要么使得样本量增大,要么有的分层下人数很少

    2,多因素分析

    统计学常用的model---logistic regression,他的偏回归系数的意思,就是在其他自变量不变的情况下, i自变量每增加一个单位,样本出现阳性结果是阴性结果的e^(βi)倍,

    偏回归系数的意义,完美的说明了逻辑回归是如何控制混杂的。

    缺点:混杂(协变量/自变量)增加,使得样本量增大(样本量为自变量个数的15倍)。

    3,倾向性评分

    使用逻辑回归,得到每个人阳性结果的概率P(y值),根据这个P,控制混杂

    常用到

    3.1 ,1:1配对,即将P接近的暴露与非暴露组中的受试者匹配。

    3.2, 根据P值大小,将人群分若干组,进行分层分析。

    3.3    将P作为协变量再次放入逻辑归回。  

    不足:未能处理未知因素所引起的残余混杂

    4,工具变量

    关键在于工具变量的选择,根据工具变量得到的某一统计量将样本分层。要求工具变量与暴露因素相关,但是与结局无关

    常用的工具变量

    4.1  地区的医疗水平

    4.2  医生的处方偏好

    4.3  医疗机构的临床实践方式

    4.4  时间特性的的工具变量

    参考:https://www.mediecogroup.com/method_topic_article_detail/135/?ty=methods

    Valar morghulis
  • 相关阅读:
    python 发送邮件
    java 获取两个时间之前所有的日期
    java 子线程定时去更改主线程的变量
    post 两种方式 application/x-www-form-urlencoded和multipart/form-data
    aws 社交媒体技术大会 部分总结
    java操作Mongodb数据库
    实体类注解 @entity
    spring security 部分注解讲解
    @Column
    阿里云搭建服务器
  • 原文地址:https://www.cnblogs.com/super-yb/p/11299279.html
Copyright © 2011-2022 走看看