zoukankan      html  css  js  c++  java
  • Weka开发[3]-Evaluation类

    上一次最后的结果就是一个分类的值,可能让大家大失所望,这一次会给大家一个比较完美的答案,这就是Evaluation类,这次只讲一下最简单的用法,首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。

           如果没有分开训练集和测试集,可以使用Cross Validation方法,EvaluationcrossValidateModel方法的四个参数分别为,第一个是分类器,第二个是在某个数据集上评价的数据集,第三个参数是交叉检验的次数(10是比较常见的),第四个是一个随机数对象。

           如果有训练集和测试集,可以使用Evaluation 类中的evaluateModel方法,方法中的参数为:第一个为一个训练过的分类器,第二个参数是在某个数据集上评价的数据集。例中我为了简单用训练集再次做为测试集,希望大家不会糊涂。

           提醒大家一下,使用crossValidateModel时,分类器不需要先训练,这其实也应该是常识了。

           Evaluation中提供了多种输出方法,大家如果用过weka软件,会发现方法输出结果与软件中某个显示结果的是对应的。例中的三个方法toClassDetailsStringtoSummaryStringtoMatrixString比较常用。

     

    package instanceTest;

     

    import java.io.FileReader;

    import java.util.Random;

     

    import weka.classifiers.Evaluation;

    import weka.classifiers.trees.J48;

    import weka.core.Instances;

     

    public class EvaluationTest

    {

    private Instances m_instances = null;

       

        public void getFileInstances( String fileName ) throws Exception

        {

            FileReader frData = new FileReader( fileName );

            m_instances = new Instances( frData );

           

            m_instances.setClassIndex( m_instances.numAttributes() - 1 );

        }

       

        public void crossValidation() throws Exception

        {

            J48 classifier = new J48();

            //NaiveBayes classifier = new NaiveBayes();

            //SMO classifier = new SMO();

           

            Evaluation eval = new Evaluation( m_instances );

            eval.crossValidateModel( classifier, m_instances, 10, new Random(1));

            System.out.println(eval.toClassDetailsString());

            System.out.println(eval.toSummaryString());

            System.out.println(eval.toMatrixString());

        }

       

        public void evaluateTestData() throws Exception

        {

            J48 classifier = new J48();

            //NaiveBayes classifier = new NaiveBayes();

            //SMO classifier = new SMO();

           

            classifier.buildClassifier( m_instances );

           

            Evaluation eval = new Evaluation( m_instances );

            eval.evaluateModel( classifier, m_instances );

            System.out.println(eval.toClassDetailsString());

            System.out.println(eval.toSummaryString());

            System.out.println(eval.toMatrixString());

        }

       

        public static void main( String[] args ) throws Exception

        {

            EvaluationTest etest = new EvaluationTest();

           

            etest.getFileInstances( "F://Program Files//Weka-3-4//data//contact-lenses.arff");

            etest.crossValidation();

            System.out.println( "*********************************** " );

            etest.evaluateTestData();

        }

    }

     

  • 相关阅读:
    编译器内置宏实现调试信息输出
    走进C标准库(4)——"stdio.h"中的putc
    走进C标准库(5)——"stdio.h"中的其他部分函数
    走进C标准库(2)——"stdio.h"中的fopen函数
    [转]深度探索C语言函数可变长参数
    C语言I博客作业02
    C语言I博客作业02
    第一周c语音作业
    什么是模块化,模块化的好处又是什么?
    服务端渲染和客户端渲染
  • 原文地址:https://www.cnblogs.com/94julia/p/4618941.html
Copyright © 2011-2022 走看看