train_test_split数据切分 - 走看看

zoukankan html css js c++ java

train_test_split数据切分

train_test_split 数据切分

格式：

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)

参数解释：
train_data：去除label的数据集！！！！
train_target：label集合！！！！
test_size：样本占比，如果是整数的话就是样本的数量
random_state：是随机数的种子。
随机数种子：其实就是该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。
随机数的产生取决于种子，随机数和种子之间的关系遵从以下两个规则：种子不同，产生不同的随机数；种子相同，即使实例不同也产生相同的随机数。

样例：

原始数据data，最后一列为标签label（也可以放在第一行）

data=[[1 0 0 ... 1 0 6]
[0 1 0 ... 0 0 9]

...
[0 0 0 ... 1 0 6]
[0 1 0 ... 0 1 9]]

train_data=[[1 0 0 ... 1 0 ]
[0 1 0 ... 0 0 ]

　　　　　　　 ...
[0 0 0 ... 1 0 ]
[0 1 0 ... 0 1 ]]

train_target=[6 9 ... 6 9]

利用切分函数train_test_split得到，训练集如下，测试集于此类似

X_train=[[1 0 0 ... 1 0 ]
[0 1 0 ... 0 0 ]

...
[0 1 0 ... 0 1 ]]

y_train=[6 9 ... 9]

参考：https://blog.csdn.net/mrxjh/article/details/78481578

查看全文

相关阅读:
hdu 1394 Minimum Inversion Number（线段树之单点更新求逆序数）
spring问题排查-调低日志等级
 android中的返回键与Activity
poj 1273 Drainage Ditches
zoj Reactor Cooling
Android build-tools升级到23.0.0_rc1无法解决编译后的问题
 HDU ACM 2845 Beans->动态规划
 HTML中心在页面上弹出自定义表单层（实现可能拖累）
欧氏定理最大公约数和最小公倍数
 token session cookie

原文地址：https://www.cnblogs.com/51python/p/10176890.html

最新文章
2016第三周二
 2016第三周一
 2016第2周日
 2016第2周六
 2016第二周五
 2016第2周四
 2016第2周三
 2016第2周二
 2016第2周一
 jQuery中间each实施例的方法

Copyright © 2011-2022 走看看