zoukankan      html  css  js  c++  java
  • 初步理解Numpy, Scipy, matplotib, pandas,

    Numpy, Scipy, matplotib, pandas,

    Numpy:

      numpy是科学计算的基础包之一,其功能包括多维数组,高等数学函数等,以及伪随机数生成器,

      scikit-learn接受numpy的数组格式数据,所用到的说有的数据都必须转换成Numpy数组,

    Scipy

      scipy是用于科学计算的函数集合,scipy最重要的就是scipy。sparse,他可以给出稀疏矩阵,

    matplotlib:

      matpoltlib是python的绘图库,如折线图,直方图,散点图等等

    pandas:

      pandas是用于处理和分析数据的库,numpy要求所有数组中元素类型必须相同,而pandas中可以互不相同。

      pandas可以从文件格式和数据库中提取数据,

    CSR格式的稀疏矩阵: 

      在scikit_learn 中 scipy的稀疏矩阵是非常重要的,稀疏矩阵会节省很多不必要的空间,只保留矩阵的非零部分和不重复部分,

      import numpy as np
      from scipy import sparse
      n = np.eye(4)
      spare = sparse.csr_matrix(n)

    COO格式的稀疏矩阵  

      eye = sparse.coo_matrix((date, (row, col)))  为稀疏矩阵的coo格式,coo格式可与csr格式相互转换,

      coo_matrix 一经定义后shape就不可更改了! 但data, row, col 可更改。 

      

      

     

     

  • 相关阅读:
    2-6 R语言基础 缺失值
    2-5 R语言基础 factor
    2-4 R语言基础 列表
    2-3 R语言基础 矩阵和数组
    2-2 R语言基础 向量
    【转】Python操作MongoDB数据库
    Python程序的执行原理
    数据分析的职业规划
    自定义菜单 开发 服务器繁忙
    微信自定义菜单
  • 原文地址:https://www.cnblogs.com/bianjing/p/9852379.html
Copyright © 2011-2022 走看看