神经网络预测mnist时候如果不归一化,则准确率仅仅10%下文作者svm也遇到了。

zoukankan html css js c++ java

神经网络预测mnist时候如果不归一化,则准确率仅仅10%下文作者svm也遇到了。

转自：http://blog.csdn.net/jeryjeryjery/article/details/72649320

这两天用Python来实现手写数字识别，刚开始用原始数据进行训练，结果预测结果都是同一个类别，全部是对应数字1。正确率也只有10%左右，下面是代码及运行结果截图：

预测结果都是数字1。

数据归一化是指将特征值从一个大范围映射到[0,1]或者[-1,1]，如果原始值都是正数，则建议选择映射到[0,1]；如果原始值有正数又有负数，则建议映射到[-1,1]；具体情况需要具体分析。映射到[0,1]的实现是:

$n e w_v a l u e = v a l u e - m i n _ v a l u e m a x _ v a l$

这样就能实现从原来的范围映射到[0,1]之间。
libsvm中提供了数据归一化工具，就是svm-scale这个工具。如果你的数据文件已经满足了svm的格式要求，即

下面以数据源train.txt为例，将其归一化到[0,1]，并存入到train-to-one.txt中，语句截图如下：

因为手写数字图片是由一系列的像素点组成的，像素值从0到255，所以可以让每一个像素值除以255，从而实现映射。可以调用svm-scale来实现，也可以直接编写java代码来实现，然后再以归一化之后的数据进行训练模型并预测，其代码和截图如下：

可以看出，准确率和速率明显提高了，不会出现仅仅只有一类的问题。但是其中的原理，本人现在还不知道，等我理解了再解释吧！

查看全文

相关阅读:
作一份高水准的简历
 使用该JavaBean可以将数据在JSP页面中以表格的形式显示出来，并具有动态排序动态生成查询自动分页功能
 javah命令 C Header and Stub File Generator
Java内部类（Inner Class）
集合（Collection）与迭代器（Iterator）
Mysql数据库从本地导出服务器上导入时报 ERROR 2005 HY000 Unknown MySQL ser
Cassandra操作入门
 表示不同文件类型的魔术数字
 JAVA中實現鏈表--LinkedList的使用
 在oracle数据库中如何插入CLOB值

原文地址：https://www.cnblogs.com/bonelee/p/7880916.html