sklearn学习--数据划分 - 走看看

zoukankan html css js c++ java

sklearn学习--数据划分
数据划分

我们可以使用交叉验证或其他划分数据集的方法对数据集多次划分，以得出模型平均的性能而不是偶然结果。sklearn 有很多划分数据集的方法，它们都在model_selection 里面，常用的有
- K折交叉验证：
- 留一法：
- 随机划分法：
以上方法除了留一法都有几个同样的参数：
- n_splits：设置划分次数
- random_state：设置随机种子
以上的划分方法各有各的优点，留一法、K折交叉验证充分利用了数据，但开销比随机划分要高，随机划分方法可以较好的控制训练集与测试集的比例。（通过设置train_size参数）。关于划分数据集的使用可以参照上面例子中的ShuffleSplit的用法，其他的函数使用方法大同小异，详细可查看官方文档。
查看全文

相关阅读:
KDD 2018 | 最佳论文：首个面向Facebook、arXiv网络图类的对抗攻击研究
 Distill详述「可微图像参数化」：神经网络可视化和风格迁移利器！
T1330 最少步数（#Ⅱ- 8）（广度优先搜索）
细胞个数题解（广度优先搜索）
DRL前沿之：Benchmarking Deep Reinforcement Learning for Continuous Control
DRL 教程 | 如何保持运动小车上的旗杆屹立不倒？TensorFlow利用A3C算法训练智能体玩CartPole游戏
 强化学习是如何解决问题的？
深度强化学习泡沫及路在何方？
ECCV 2018 | UBC&腾讯AI Lab提出首个模块化GAN架构，搞定任意图像PS组合
 纵览神经架构搜索方法

原文地址：https://www.cnblogs.com/huangmouren233/p/14912539.html

Copyright © 2011-2022 走看看