Rosenbaum和Rubin于1983年提出了倾向得分的概念。
倾向得分(Propensity Score)定义为“个体在一组既定的协变量下,接受某种参与(Treatment)的可能性”。
它要解决的问题是,因为如果针对多个可观察特征X进行对比匹配非常困难,所以,可将多维协变量X用一个一维变量——倾向得分P(x)来代替,这样,研究者就只需要对单一的倾向得分变量进行匹配,从而大大减少了匹配的困难。
--百度百科
以公共卫生学为例,假设研究问题是吸烟对于大众健康的影响,研究人员常常得到的数据是观察研究数据,而不是随机对照实验数据(Randomized Controlled Trial data),因为吸烟者的行为和结果,以及不吸烟者的行为和结果,是很容易观察到的。但如果要进行随机对照实验,招收大量被试,然后随机分配到吸烟组和不吸烟组,这种实验设计不太容易实现,也并不符合科研伦理。这种情况下观察研究是最合适的研究方法。但是面对最容易获得的观察研究数据,如果不加调整,很容易获得错误的结论,比如拿吸烟组健康状况最好的一些人和不吸烟组健康状况最不好的一些人作对比,得出吸烟对于健康并无负面影响的结论。从统计学角度分析原因,这是因为观察研究并未采用随机分组的方法,无法基于大数定理的作用,在实验组和对照组之间削弱混杂变量的影响,很容易产生系统性的偏差。倾向评分匹配就是用来解决这个问题,消除组别之间的干扰因素。
为什么要做?
1.解决样本选择性偏差
2.遗漏关键变量造成的内生性问题
什么时候需要做?--应用场景
- 实验研究:有实验组、对照组
- 政策研究:对比政策前后的变化
- 其他需要对比两组、多组样本的情况
原理:
选择性偏误
实证研究中,由于存在很多其他变量混淆自变量和因变量之间的关系,研究者很难直接探索二者之间的净效果(net effects)。
这些混淆变量的影响通常被称为选择性误差(selectionbias)。由于个体通常会根据其参加项目的预期收益而自我选择是否参加项目,导致对平均处理效应的估计带来困难。
条件独立假设
控制住所有控制变量(协变量),因变量与分到实验组还是对照组无关。
匹配得分
由于选择两组在很多协变量上一致的样本很困难,则将很多协变量转换成一个变量的得分,再选择两组得分相同或相近的样本。
多个协变量生成一个得分,最常用的模型是Logistic回归。