sklearn之划分数据集 - 走看看

zoukankan html css js c++ java

sklearn之划分数据集

随机划分

from sklearn.model_select import train_test_split

x_train, x_test, y_train，y_test = train_test_split(x, y, test_size=0.25, ramdon_state=0)

参数解释：

x：被划分的样本特征集

y：被划分的样本标签

test_size：如果是浮点数，在0-1之间，表示样本占比；如果是整数的话就是样本数量

random_state：随机数的种子。可以看作是数据划分规则ID，取值范围为0-2^32。等于0或None时可以理解为随机分配一个整数给random_state，会导致每次运行结果不同。一般都会固定数值，防止运行结果不同。

比如有数据集[1,2,3,4,5,6,7,8,9],我们确定test_size=3,那问题是应该取哪三个数作为test set呢，这时候就应该使用random_state来确定随机规则：random_state=1，它按一定的规则去取出数据；random_state=2时，它又换成另一种规则去取数据。

查看全文

相关阅读:
修改host批量处理.bat
当前标识(IIS APPPOOL如来官网)没有对“C:WindowsMicrosoft.NETFramework64v4.0.30319Temporary ASP.NET Files”的写访问权限。
SQL Server 2005基础应用视频教程下载学习
 .netcore获取已注入的服务
 触发器设置递归
 Attention Is All You Need
FreeSwitch LUA API —— Sessions
扇贝背单词，增加单词快捷文本复制按钮需要安装tampermonkey
java G711 流式编码和解码方法
 Webrtc 介绍与Demo环境搭建

原文地址：https://www.cnblogs.com/myshuzhimei/p/11778597.html

Copyright © 2011-2022 走看看