分类算法优缺点对比
1 贝叶斯分类器
优点:接受大量数据训练和查询时所具备的高速度,支持增量式训练;对分类器实际学习的解释相对简单
缺点:无法处理基于特征组合所产生的变化结果
2 决策树分类器
优点:很容易解释一个受训模型,而且算法将最为重要的判断因素都很好的安排在了靠近树的根部位置;能够同时处理分类数据和数值数据;很容易处理变量之间的相互影响;适合小规模数据
缺点:不擅长对数值结果进行预测;不支持增量式训练
3 神经网络
优点:能够处理复杂的非线性函数,并且能发现不同输入间的依赖关系;支持增量式训练
缺点:黑盒方法,无法确定推导过程;选择训练数据的比率与问题相适应的网络规模方面,没有明确的规则可以遵循,选择过高的训练数据比率有可能导致网络对噪声数据产生过渡归纳的现象,而选择过低的训练比率,则意味着除了已知数据,网络有可能不会再进一步学习了。
4 支持向量机
优点:通过将分类输入转化成数值输入,可以令支持向量同时支持分类数据和数值数据;适合大规模数据
缺点:针对每个数据集的最佳核变函数及其相应的参数都是不一样的,而且每当遇到新的数据集都必须重新确定这些函数及其参数;黑盒技术,由于存在高维空间的变换,SVM的分类过程更加难以解释。
5 K-最近邻
优点:能够利用复杂函数进行数值预测,同时又保持简单易懂的特点;合理的数据缩放量;在线(online)技术,新数据可以随时被添加进来,而不必重新进行训练。
缺点:要求所有训练数据都必须缺一不可;寻找合理的缩放因子比较乏味
sourceinsight 相对路径设置
在创建source insight工程时,最好用“相对路径”,并“将si的工程文件,保存到源码包里”!
这样一来,等以后,将源码包放置于硬盘上其他位置,或分发给其他人,或改了源码包的名称,si工程仍然能用!
方法步骤如下:
以建立一个阅读busy-box源码的工程为例。
有如下目录:
E:codeusybox-1.7.0,其中存放的是busybox的源码,那里面有很对文件和目录。
E:codesi,其中存放的是sourceinsight的工程文件。
为了实现当将code目录移动到其他目录下时(或者单独将busybox-1.7.0和si移动到其他目录下,但是他俩都在同一目录下,如移动到D盘,此时的目录结构是D:busybox-1.7.0和D:si),sourceinsight工程仍然可以使用。
建立并设置sourceinsight工程的目录为:E:codesi
设置项目源码的路径为:E:codeusybox-1.7.0
添加项目源码(也可以先不添加源码,等下面的相对路径设置好之后在添加)。
同步文件
选择:菜单项“project->default project setting...”
修改project source directory(项目源码目录),将E:codeusybox-1.7.0修改为 ..usybox-1.7.0。
(这是简单的相对路径的表示方法,是项目源码路径将对于sourceinsight工程目录,需要根据实际情况修改)
原来的目录:E:codeusybox-1.7.0
修改后的路径 ..usybox-1.7.0
完毕!!!
接下来测试一下,将他俩同事拷贝到D盘下,看还能不能用。
进入si,双击busybox_1_7.PR
发现还可以用
再来看看菜单项“project->default project setting...”,发现已经自动变成了D:usybox-1.7.0。