zoukankan      html  css  js  c++  java
  • 在python&numpy中切片(slice)

    在python&numpy中切片(slice)

    上文说到了,词频的统计在数据挖掘中使用的频率很高,而切片的操作同样是如此。在从文本文件或数据库中读取数据后,需要对数据进行预处理的操作。此时就需要对数据进行变换,切片,来生成自己需要的数据形式。

    对于一维数组来说,python原生的list和numpy的array的切片操作都是相同的。无非是记住一个规则arr_name[start: end: step],就可以了。

    实例:

    下面是几个特殊的例子:

    • [:]表示复制源列表
    • 负的index表示,从后往前。-1表示最后一个元素。

    相对于一维数组而言,二维(多维)数组用的会更多。一般语法是arr_name[行操作, 列操作]
    先随机产生一个3*4的数组。

    in:arr = np.arange(12).reshape((3, 4)) 
    
    out:
    array([[ 0,  1,  2,  3],
           [ 4,  5,  6,  7],
           [ 8,  9, 10, 11]])
    
    • 取行数据
    arr[i, :] #取第i行数据
    arr[i:j, :] #取第i行到第j行的数据
    
    • 取列数据(注意数据格式)
    in:arr[:,0] # 取第0列的数据,以行的形式返回的
    out:
    array([0, 4, 8])
    
    in:arr[:,:1] # 取第0列的数据,以列的形式返回的
    out:
    array([[0],
           [4],
           [8]])
    
    
    • 取一个数据块
    # 取第一维的索引1到索引2之间的元素,也就是第二行 
    # 取第二维的索引1到索引3之间的元素,也就是第二列和第三列
    in:arr[1:2, 1:3] 
    
    out: 
    array([[5, 6]])
    
    
     # 取第一维的全部 
     # 按步长为2取第二维的索引0到末尾之间的元素,也就是第一列和第三列
    in: arr[:, ::2]
    
    out: 
    array([[ 0,  2],
           [ 4,  6],
           [ 8, 10]])
    

    参考文献

  • 相关阅读:
    VBA.replace替换单引号或双引号
    读取文件
    UPDATE
    alter update
    SQL日期格式
    python map的用法
    python os模块用法
    python re.I compile search
    python 正则匹配
    通过list中值得名称查询索引号
  • 原文地址:https://www.cnblogs.com/Sinte-Beuve/p/6573246.html
Copyright © 2011-2022 走看看