利用SVM算法进行文本分类
数据集
两位不同作家的作品(金庸&刘慈欣)切分出来的小样本。根据自己构建的词汇表,将样本转化为一个1000维的0-1向量(仅统计词汇是否出现)。再加上一个0-1标记作家
模型
SVM linearKernel
损失函数
优化方法