1 LIBSVM介绍
LIBSVM是众所周知的支持向量机分类工具包(一些支持向量机(SVM)的开源代码库的链接及其简介),运用方便简单,其中的核函数(常用核函数-Kernel Function)可以自己定义也可以默认。但是对一些大数据来说,有没有非线性映射,他们的性能差不多。如果不使用核,我们可以用线性分类或者回归来训练一个更大的数据集。这些数据往往具有非常高维的特征,例如文本分类Document classification。所以LIBSVM就诞生了。
关于liblinear 和 libSVM的详细介绍及其比较可以参见链接:
2 Libsvm的MATLAB安装步骤
(1)下载安装包:http://download.csdn.net/detail/tiandijun/8136887
我使用的是最新版本liblinear1.95,MATLAB是R2012b.
(2)解压到相应的文件夹,在MATLAB中设置子路径,打开matlab,点击File->SetPath->Add withSubfolders,找到liblinear-1.95matlab所在文件夹,点击save,点击close。
(3)在matlab的command window中输入mex -setup,选择合适的编译器,具体如下:
上图最后的“y”是自己手动输入进去的,表示同意选择编译方式。
(4)输入“2”作为编译环境
确认,输入“y”
结果图如下;
(5)在matlab的command window中输入make,如果正确的话,会如下所示:
同时,可以看到在当前目录下生成下图中的文件
特别是生成train.mexw32和predict.mexw32.
到这一步,Liblinear安装成功。
3 在matlab中测试Liblinear是否能用
model = train(svm_category', sparseTrainMatrix)
[output_label, accuracy] = predict(svm_category', sparseTestMatrix, model);
train中参数:svm_category'为列向量,表示training set的class label,假设为n维
sparseTrainMatrix为n*m维矩阵,n表示training set中样本的个数,m表示每个样本中feature的个数
model的内容为
predict中参数和train中取的类似,本例中直接把training set作为testing set重新预测了一下,model为train中输出的结构体
output_label输出的是testing set的class label的预测值
accuracy是预测准确度
到此结束。(注:具体数据可参考Andrew Ng的CS229课程problem set2的第二题)
具体运行还没有成功,欢迎讨论和指点。