机器学习 demo分西瓜

zoukankan html css js c++ java

机器学习 demo分西瓜
周老师的书，对神经网络写了一个小的Demo

是最简单的神经网络，只有一层的隐藏层。

这次练习依旧是对西瓜的好坏进行预测。

主要分了以下几个步骤

1、数据预处理

对西瓜的不同特性进行数学编码表示（0~1），我是直接编了对应数字。含糖量已经是一个0~1之间的数，所以就没有进行处理

青绿 1

乌黑 0.5

浅白 0

蜷缩 1

稍蜷 0.5

硬挺 0

浊响 1

沉闷 0.5

清脆 0

清晰 1

稍糊 0.5

模糊 0

凹陷 1

稍凹 0.5

平坦 0

硬滑 1

软黏 0

2、训练集和检测集
[java] view plain copy

package BP;



public class TrainData {

    double[][] traindata;

    double[][] traindataoutput;

    double[][] testdata;

    double[][] testdataoutput;

    public TrainData(){

        traindata = new double[][]{

            new double[]{1,1,1,1,1,1,0.697,0.460},

            new double[]{0.5,1,0.5,1,1,1,0.774,0.376},

            new double[]{0.5,1,1,1,1,1,0.634,0.264},

            //new double[]{1,1,0.5,1,1,1,0.608,0.318,1},

            //new double[]{0,1,1,1,1,1,0.556,0.215,1},

            new double[]{1,0.5,1,1,0.5,0,0.403,0.237},

            new double[]{0.5,0.5,1,0.5,0.5,0,0.481,0.149},

            //new double[]{0.5,0.5,1,1,0.5,1,0.437,0.211,1},



            //new double[]{0.5,0.5,0.5,0.5,0.5,1,0.666,0.091,0},

            //new double[]{1,0,0,1,0,0,0.243,0.267,0},

            //new double[]{0,0,0,0,0,1,0.245,0.057,0},

            //new double[]{0,1,1,0,0,0,0.343,0.099,0},

            new double[]{1,0.5,1,0.5,1,1,0.639,0.161},

            new double[]{0,0.5,0,0.5,1,1,0.657,0.198},

            new double[]{0.5,0.5,1,1,0.5,0,0.360,0.370},

            new double[]{0,1,1,0,0,1,0.593,0.042},

            new double[]{1,1,0.5,0.5,0.5,1,0.719,0.103}

        };

        traindataoutput = new double[][]{

            new double[]{1},

            new double[]{1},

            new double[]{1},

            new double[]{1},

            new double[]{1},

            new double[]{0},

            new double[]{0},

            new double[]{0},

            new double[]{0},

            new double[]{0},

        };

        testdata = new double[][]{

            new double[]{1,1,0.5,1,1,1,0.608,0.318},

            new double[]{0,1,1,1,1,1,0.556,0.215},

            new double[]{0.5,0.5,1,1,0.5,1,0.437,0.211},



            new double[]{0.5,0.5,0.5,0.5,0.5,1,0.666,0.091},

            new double[]{1,0,0,1,0,0,0.243,0.267},

            new double[]{0,0,0,0,0,1,0.245,0.057},

            new double[]{0,1,1,0,0,0,0.343,0.099},

        };

        testdataoutput = new double[][]{

            new double[]{1},

            new double[]{1},

            new double[]{1},

            new double[]{0},

            new double[]{0},

            new double[]{0},

            new double[]{0},

        };

    }

    public static void main(String[] args){

        TrainData t = new TrainData();

        for(int i=0;i<t.traindata.length;i++){

            for(int j=0;j<9;j++)

                System.out.print(t.traindata[i][j]+ " ");

            System.out.println();

        }

    }

}
3、BP主函数
[java] view plain copy

package BP;



import java.util.Random;



public class BP {

    int innum;

    int hiddennum;

    int outnum;

    //输入、隐藏、输出层

    public double[] input;

    public double[] hidden;

    //output为本神经网络计算出的输出值

    public double[] output;



    //realoutput为训练网络时，用户提供的真的输出值

    public double[] realoutput;



    //v[i,j]表示输入层i到隐层j  w[i,j]表示隐层i到输出层j

    public double[][] v;

    public double[][] w;



    //beta为隐层的阈值，afa为输出层阈值

    public double[] beta;

    public double[] afa;



    //学习率

    public double eta;

    //步长

    public double momentum;

    public final Random random;



    public BP(int inputnum,int hiddennum,int outputnum,double learningrate){

        innum = inputnum;

        this.hiddennum = hiddennum;

        outnum = outputnum;



        input = new double[inputnum + 1];

        hidden = new double[hiddennum + 1];

        output = new double[outputnum + 1];

        realoutput = new double[outputnum + 1];



        v = new double[inputnum + 1][hiddennum + 1];

        w = new double[hiddennum + 1][outputnum + 1];



        beta = new double[outputnum + 1];

        afa = new double[hiddennum + 1];

        for(int i=0;i<outputnum;i++)

            beta[i] = 0.0;

        for(int i=0;i<hiddennum;i++)

            afa[i] = 0.0;



        eta = learningrate;

        //随机数对结果影响较大

        random = new Random(19950326);

        randomizeWeights(w);

        randomizeWeights(v);

    }



    public void testData(double[] in){

        input = in;

        getNetOutput();

    }

    //只对本题目有用，output>0.5时为好西瓜，output<0.5时为坏西瓜

    public int predict(double[] in){

        testData(in);

        if(output[0]>0.5)

            return 1;

        else

            return 0;

    }

    //获得在test集上的正确率

    public double getAccuracy(double[][] in,double[][] out){

        int rightans = 0,wrongans = 0;

        for(int i=0;i<in.length;i++){

            if(predict(in[i])==(out[i][0])){

                //System.out.println("预测结果："+predict(in[i])+" 实际结果为："+out[i][0]);

                rightans++;

            }else{

                //System.out.println("预测结果："+predict(in[i])+" 实际结果为："+out[i][0]);

                wrongans++;

            }

        }

        System.out.println("对："+rightans+" 错："+wrongans);

        return (double)rightans/(double)(rightans+wrongans);

    }

    //times为进行几轮训练

    public void train(int times){

        TrainData t = new TrainData();

        double wu = 0.0,acc = 0.0;

        int n = t.traindata.length;

        for(int i=0;i<times;i++){

            wu = 0.0;

            for(int j=0;j<n;j++){

                traindata(t.traindata[j],t.traindataoutput[j]);

                wu += getDeviation();

            }

            wu = wu/((double)n);

            System.out.println("第"+i+"轮训练："+wu);

            acc = getAccuracy(t.testdata,t.testdataoutput);

            System.out.println("预测正确率为： "+acc);

        }

    }

    //对一个input输入进行训练

    public void traindata(double[] in,double[] out){

        input = in;

        realoutput = out;

        getNetOutput();

        adjustParameter();

    }

    //获得误差E

    public double getDeviation(){

        double e = 0.0;

        for(int i=0;i<outnum;i++)

            e += (output[i] - realoutput[i])*(output[i] - realoutput[i]);

        e *= 0.5;

        return e;

    }

    //调整权值

    public void adjustParameter(){

        double g[],e = 0.0;

        g = new double[outnum];

        int i,j;

        for(i=0;i<outnum;i++){

            g[i] = output[i]*(1-output[i])*(realoutput[i]-output[i]);

            beta[i] -= eta * g[i];

            for(j=0;j<hiddennum;j++){

                w[j][i] += eta * g[i] * hidden[j];

            }

        }

        for(i=0;i<hiddennum;i++){

            e = 0.0;

            for(j=0;j<outnum;j++)

                e += g[j]*w[i][j];

            e = hidden[i]*(1-hidden[i])*e;

            afa[i] -= eta * e;

            for(j=0;j<innum;j++)

                v[j][i] += eta * e * input[j];

        }

    }

    //获得output

    public void getNetOutput(){

        int i,j;

        double tmp=0.0;

        for(i=0;i<hiddennum;i++){

            tmp = 0.0;

            for(j=0;j<innum;j++)

                tmp += v[j][i]*input[j];

            hidden[i] = sigmoid(tmp-afa[i]);

        }

        for(i=0;i<outnum;i++){

            tmp = 0.0;

            for(j=0;j<hiddennum;j++)

                tmp += w[j][i]*hidden[j];

            output[i] = sigmoid(tmp-beta[i]);

        }

    }

    //对权值矩阵w、v进行初始随机化

    private void randomizeWeights(double[][] matrix) {

        for (int i = 0, len = matrix.length; i != len; i++)

            for (int j = 0, len2 = matrix[i].length; j != len2; j++) {

                double real = random.nextDouble();

                matrix[i][j] = random.nextDouble() > 0.5 ? real : -real;

            }

    }

    public void debug(){

        System.out.println("========begin=======");

        for(int i=0;i<innum;i++){

            for(int j=0;j<hiddennum;j++)

                System.out.print(v[i][j]+" ");

            System.out.println();

        }

        System.out.println();

        for(int i=0;i<hiddennum;i++){

            for(int j=0;j<outnum;j++)

                System.out.print(w[i][j]+" ");

            System.out.println();

        }

        System.out.println("========end=======");

    }

    public double sigmoid(double z){

        double s = 0.0;

        s = 1d/(1d + Math.exp(-z));

        return s;

    }



    public static void main(String[] args){

        BP bp = new BP(8,10,1,0.1);

        bp.train(50);

    }

}
我要说的：

就结果来说，在验证集上的正确率可达到85%，当然很大程度上取决于BP初始化时random函数的种子。运气好的时候甚至能达到100%的正确率，运气不好的时候只有40%多，跟随便乱猜没什么区别。

想问大神。。。只能采用这种随机算法来找到一个最合适的ramdom种子值嘛？能不能用遗传这样的开放式算法进行搜索来找到最合适的随机值（我觉得随机的种子和随机结果并没有什么直接的关联，所以不知道能不能用遗传算法之列。。。）
查看全文

相关阅读:
js中如何在不影响既有事件监听的前提下新增监听器
 史上最走心webpack4.0中级教程——配置之外你应该知道的事
 webpack4.0各个击破（10）—— Integration篇
 webpack4.0各个击破（9）—— karma篇
 webpack4.0各个击破（8）—— tapable篇
 webpack4.0各个击破（7）—— plugin篇
 MYSQL的安装
 数据库的分类
 python接口调用把执行结果追加到测试用例中
 python分布式接口，参数化实战二

原文地址：https://www.cnblogs.com/qiaoyanlin/p/6888617.html