zoukankan      html  css  js  c++  java
  • randomForest R 学习笔记

    object type

    randomForest 会根据变量的类型来决定regressionclassificationclass(iris$Species)是 factor,所以是classification

    iris.rf$type
    [1] "classification"
    

    iris example

    data(iris)
    set.seed(111)
    ind <- sample(2, nrow(iris), replace = TRUE, prob=c(0.8, 0.2))
    iris.rf <- randomForest(formula = Species ~ ., data=iris[ind == 1,])
    iris.pred <- predict(object = iris.rf, newdata = iris[ind == 2,])
    table(observed = iris[ind==2, "Species"], predicted = iris.pred)
    
    • formula: Species ~ 意味着 Speciesresponsedata中的其他变量都是predictor
    • newdata: 可以不用指明 predictor 和 response

    test

    xtest = subset(test_data, select=-y)
    ytest = test_data$y

    ytest= subset(test_data, select=y) 会报错

    注意:一旦提供了xtestkeep.forest默认会被设置为FALSE,trees不会保存,模型中包含xtest的预测值,但是模型不能用来predict

    local importance

    localImp 计算的是,针对每个case,不同变量的importance。
    importance统计的是整体而言,不同变量的importance。

  • 相关阅读:
    VS2017专业版和企业版激活密钥
    RabbitMQ卸载重新安装
    RabbitMQ-基本命令操作
    天猫
    铜氨纤维
    四肢很发达,头脑不简单
    运动可以健身健脑
    1 职业天花板来自认识的局限性
    天猫-服饰行业标准
    服装设计都是需要什么
  • 原文地址:https://www.cnblogs.com/yaos/p/14014228.html
Copyright © 2011-2022 走看看