zoukankan      html  css  js  c++  java
  • pandas.DataFrame.sample随机抽样

    原文:https://www.cnblogs.com/webRobot/p/11484648.html

    1    数据切片选取
    1.1    pandas.DataFrame.sample 随机选取若干行
    1.1.1     功能说明
                 有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。

    功能相似:numpy.random.choice
        Generates a random sample from a given 1-D numpy array.

    1.1.2     使用说明
    1.    函数名及功能
    DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)[source]

    2.    输入参数说明

    参数名称 参数说明 举例说明
    n 要抽取的行数
    df.sample(n=3,random_state=1)
    提取3行数据列表
    注意,使用random_state,以确保可重复性的例子。

    frac
    抽取行的比例
    例如frac=0.8,就是抽取其中80%。

    df.sample(frac=0.8, replace=True, random_state=1)
    replace
    是否为有放回抽样,
    True:有放回抽样
    False:未放回抽样

    True:取行数据后,可以重复放回后再取
    False:取行数据后不放回,下次取其它行数据
    注意:当N>总数据容量,replace设置为值时有效

    weights
    字符索引或概率数组

    axis=0:为行字符索引或概率数组
    axis=1:为列字符索引或概率数组

     
    random_state
    int: 随机数发生器种子
    或numpy.random.RandomState

    random_state=None,取得数据不重复
    random_state=1,可以取得重复数据

    axis
    选择抽取数据的行还是列
    axis=0:抽取行
    axis=1:抽取列

    也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行。
    3.    返回值说明
    返回选择的N行元素的DataFrame对象。

    https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149(博主视频教学主页)

  • 相关阅读:
    text/css什麼意思
    w3cschool的在線編輯器的特點
    html
    notepad编写html
    html学习心得
    html 链接
    資料鏈接
    微信小程序的界面下拉刷新
    C# PictureBox控件畫圖
    CPK公式
  • 原文地址:https://www.cnblogs.com/isme-zjh/p/13359290.html
Copyright © 2011-2022 走看看