Cross Validation 交叉验证

zoukankan html css js c++ java

Cross Validation 交叉验证
传统的(F-measure)或平衡的(F-score) (F1 score)是精度和召回的调和平均值：

(F_1 = 2 frac{precision*recall}{precision + recall})

交叉验证

cross validation大概的意思是：对于原始数据我们要将其一部分分为train_data，一部分分为test_data。train_data用于训练，test_data用于测试准确率。在test_data上测试的结果叫做validation_error。将一个算法作用于一个原始数据，我们不可能只做出随机的划分一次train和test_data，然后得到一个validation_error，就作为衡量这个算法好坏的标准。因为这样存在偶然性。我们必须好多次的随机的划分train_data和test_data，分别在其上面算出各自的validation_error。这样就有一组validation_error，根据这一组validation_error，就可以较好的准确的衡量算法的好坏。

cross validation是在数据量有限的情况下的非常好的一个evaluate performance的方法。而对原始数据划分出train data和test data的方法有很多种，这也就造成了cross validation的方法有很多种。

带乱序的

使用下面的公式可以进行5折交叉验证，cross_val_score函数是进行交叉验证并计算出Validation_score的，但是其中的cross validation并没有打乱原始数据的顺序，所以使用Kfold函数构建cv变量，传递给cross_val_score的cv参数，其中scoring参数可以指定计算准确率的方式
```
#Validation function
n_folds = 5

def rmsle_cv(model):
    kf = KFold(n_folds, shuffle=True, random_state=42).get_n_splits(train.values)
    rmse= np.sqrt(-cross_val_score(model, train.values, y_train, scoring="neg_mean_squared_error", cv = kf))
    return(rmse)
```
查看全文

相关阅读:
01背包
 用动态规划求两个自然数的最大公约数
 编程实现文件的复制功能，要求源文件名及目标文件名在程序运行后根据提示输入
 this和super
JAVA中static的使用
 结构化异常处理笔记
 继承和多态笔记
 javascript 客户端验证和页面特效制作学习笔记
 定义封装的类类型笔记
 C# 核心编程结构Ⅱ 笔记

原文地址：https://www.cnblogs.com/drawon/p/8520629.html

热门文章
prototype模式
 CDocument
CHzSeg
Crtforwardidx
二分图匹配匈牙利算法DFS实现
 builder模式
 List_java270
最长不下降子序列
 加密解密
 list_java270.2

Cross Validation 交叉验证

交叉验证

带乱序的