zoukankan      html  css  js  c++  java
  • 机器学习入门-数据下采样 np.random_choice

    1. np.random_choice(array, len)  进行随机的数据选择,array表示抽取的对象,len表示抽取样本的个数

    数据的下采样是对多的数据进行np.random.choice 随机的抽取,抽取出于少的样本相同的索引个数,将两组索引进行合并,从原始数据中重新取值

    # 2 进行数据的下采样
    
    negtive_len = len(data[data.Class==1])
    negtive_index = data[data.Class==1].index
    
    # 获得正常样本的数据便签
    normal_len = len(data[data.Class==0])
    normal_index = data[data.Class==0].index
    # 随机抽取
    under_normal_index = np.random.choice(normal_index, negtive_len)
    # 将两个样本的索引进行合并
    under_index = np.concatenate([negtive_index, under_normal_index])
    
    under_data = data.iloc[under_index, :]
    under_x = under_data.loc[:, under_data.columns != 'Class']
    under_y = under_data.loc[:, under_data.columns == 'Class']
  • 相关阅读:
    03.通过商品课程初心商品信息
    04.支付宝支付流程
    02.创建商品(表)应用(App)
    01.商品模块表结构
    七牛云上传视频
    Django之序列化器
    Django之抽象基类
    权限系统
    python实现简单工厂模式
    01.git基本操作
  • 原文地址:https://www.cnblogs.com/my-love-is-python/p/10271330.html
Copyright © 2011-2022 走看看