Drug side effect extraction from clinical narratives of psychiatry and psychology patients
任何一个病或症状的命名实体都是一个潜在的副作用PSE,有一个窗口,如果一个句子里有药名和PSE,那么窗口放这一个句子,如果没有,就找上一个句子,如果有药名,就窗口放两个句子。然后写匹配规则。只应用一个规则来计算精度P,最高的优先被使用。然后依次进行,知道匹配被发现或者所有规则用完。
假阳性错误,需要更深层次的语义挖掘
假阴性错误,不能提取到正确的副作用
改进的方法:
Coreference analysis in clinical notes: a multi-pass sieve with alternate anaphora resolution modules 2012
要建造一个系统把markbles和相应的实体联系起来。我们使用了多次筛算法,使用严谨的顺序的确定的规则,同时收集文件中实体有关的信息。我们的系统MedCoref采用了国家的最先进的机器学习框架作为一种替代在最后以规则为基础的代名词分辨筛选。结果:筛选集是0.843,测试集是0.836。有监督的机器学习通常使用一个单一的方法不能容纳不规则的数据尤其是例子少的时候,并且一个完全确定的系统在规则不完全的情况下会灵敏度差(召回下降)。基于筛选的框架可以同一个可靠地使用专家设计规则的机器学习组件结合。结论:使用相对简单的规则,词性信息,和语义类型属性,建立一个有效的指代消解系统。
A common type system for clinical natural language processing
利用深层语义解决不同类型数据的处理问题。使用UIMA和cTAKES。定义了模型。