zoukankan      html  css  js  c++  java
  • Python项目代码阅读【不断更新】

    一.数据读取:
      #数据分割 val_files = np.array_split(list_files, self.n_folds)
      np.split() 均等分割,不均等会报错
      np.array_split() 不均等分割,不会报错
      
      #训练集和验证集 train_files = np.setdiff1d(list_files, val_files[self.fold_idx])
      setdiff1d(ar1, ar2, assume_unique=False) 在ar1中但不在ar2中的已排序唯一值。assume_unique表示如果有多个相同的值是否视为同一个。 

      #交叉验证 20折表示19份作为训练1份作为验证,轮20次,最后所有验证集平均结果作为评判性能指标
      https://blog.csdn.net/weixin_40475450/article/details/80578943

      #删除维度 tmp_data = np.squeeze(tmp_data) numpy.squeeze(a,axis = None)
        1)a表示输入的数组; 2)axis用于指定需要删除的维度,但是指定的维度必须为单维度,否则将会报错;
        3)axis的取值可为None 或 int 或 tuple of ints, 若axis为空,则删除所有单维度的条目;

      #加入新维度 tmp_data = tmp_data[:, :, np.newaxis, np.newaxis]
      np.newaxis 指定位置加入新维度,如x为5*5,x[np.newaxis, ..., np.newaxis, np.newaxis]后变成1*5*5*1*1

      #加载目录下的所有文件 allfiles = os.listdir(self.data_dir)
        返回该目录下所有文件名的list

      #数据水平拼接 np.hstack(label_train)
        np.vstack():在竖直方向上堆叠
        np.hstack():在水平方向上平铺


      #数据按列拼接 np.r_[x_train_data, x_temp]
        np.r_是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等。
        np.c_是按行连接两个矩阵,就是把两矩阵左右相加,要求行数相等。

      
    #打乱数据顺序 np.random.shuffle(train_data)
      训练数据在训练之前一定要打乱顺序


      #五步加载数据
      https://blog.csdn.net/rainweic/article/details/95737315
    allfiles = os.listdir(self.data_dir) 
  • 相关阅读:
    递归树结构封装
    Excel父子数据导入
    资产类标准数据源抽取顺序
    资产模型数据初始化时应注意的事项
    Input Parameters and Variables in SAP HANA Modeling
    2LIS_03_BX数据源的用处及抽取步骤
    BW资产数据源抽取顺序
    MM物料移动BW数据源介绍
    关于BW newGL datasource
    使用SLT系统抽数到hana系统
  • 原文地址:https://www.cnblogs.com/Amyheartxy/p/12560855.html
Copyright © 2011-2022 走看看