最近发现有很多文章采用reference-free的方式来进行去卷积,所谓的reference-free其实就是指不进行基因筛选,直接用所有基因作为特征进行去卷积操作.
我个人是不怎么推荐这样的方式,数据挖掘发展了这么多年,特征选择和特征提取开发出了琳琅满目,各式各样的算法,现在你又回到使用所有特征的起点,我觉得是一种非常严重的倒退.
可能采用这种方式是为了提高去卷积的正确率,但是我依然不怎么认同,提高正确率不应该是通过这样的方式.试问:
A) 用10000基因构建的芯片,正确率为90%,售价为1000元,
B) 用5000基因构建的芯片,正确率为85%,售价为500元,
C) 用1000基因构建的芯片,正确率为80%,售价为200元.
我觉得正常来说值得纠结是只会是在B和C之间做选择,A一定是被首先淘汰的选项.
我愿意花更多的精力在 "尽可能少的降低正确率的前提下,让特征尽可能的少",而不是这种粗暴的不进行特征选择.
小小拙见.