zoukankan      html  css  js  c++  java
  • ML(3.2): NavieBayes R_kalR

           ML3.1 介绍e1071包实施朴素贝叶斯分类的函数,本例使用klaR包中的NaiveBayes函数,因为该函数较之前者增加了两个功能,一个是可以输入先验概率,另一个是在正态分布基础上增加了核平滑密度函数。为了避免过度拟合,在训练时还要将数据分割进行多重检验,所以我们还使用了caret包的一些函数进行配合。

        caret::train

        语法: train(form, data, ..., weights, subset, na.action = na.fail, contrasts = NULL)

    • 安装程序包
      install.packages("caret")
      install.packages("mlbench")
      install.package("klaR")
    • 创建训练集和测试集
      library(lattice)
      library(ggplot2)
      library(caret)
      library(mlbench)
      library(MASS)
      library(klaR)
      
      # 使用朴素贝叶斯建模,这里使用了三次10折交叉检验得到30个结果
      fitControl <- trainControl(method = "repeatedcv", number = 10, repeats = 3,returnResamp = "all")
      model1 <- train(Species~., data = iris.train,method='nb',trControl = fitControl)
    • 加载包 使用朴素贝叶斯建模
      fitControl <- trainControl(method = "repeatedcv", number = 10, repeats = 3,returnResamp = "all")
      model1 <- train(Species~., data = iris.train,method='nb',trControl = fitControl)
    • 返回测试数据的混淆矩阵
      > pred3 <- predict(model1, iris.test, type="raw")
      > table(pred3,iris.test$Species)
                  
      pred3        setosa versicolor virginica
        setosa         10          0         0
        versicolor      0         18         2
        virginica       0          0        20

     

     

  • 相关阅读:
    Hive_进阶
    日志分析_统计每日各时段的的PV,UV
    Sqoop_mysql,hive,hdfs导入导出操作
    Sqoop_ 简单介绍
    Sqoop_ 从 hive 导到mysql常遇九问题总结(转)
    MySql_设置编码
    Linux_MySql_yum_安装
    Hive_DDL与DML
    UI自动化持续化集成
    HDU 5073 数学题
  • 原文地址:https://www.cnblogs.com/tgzhu/p/6731563.html
Copyright © 2011-2022 走看看