zoukankan      html  css  js  c++  java
  • 机器学习入门 【二】

    常用库简介

    Numpy 基础科学计算库

    Scipy 强大的科学计算工具集

    Pandas 数据分析的利器

    Matplotlib 画出优美的图形

    Scikit-learn 机器学习库

    Numpy

    【sklearn使用numpy数组形式的数据进行处理,所以需要把数据转换为numpy数组形式,其中的多维数组也是numpy的核心功能之一】

    import numpy
    i = numpy.array([[520,13,14],[25,9,178]])
    print("i: {}".format(i))

    给变量i复制为一个数组
    i是一个典型的numpy数组

    结果:

    sklearn需要使用scipy来对算法进行执行
    sparse函数,用来生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数组为0的np数组 【常用】
    sparse用法
    import numpy as np
    from scipy import sparse
    matrix = np.eye(6)
    #用eye函数生成一个6*6对角矩阵
    #矩阵中对角线上的元素数值为1,其余都是0
    sparse_matrix = sparse.csr_matrix(matrix)
    #这一行把np数组转化为CSR格式的scripy稀疏矩阵(sparse matrix)
    #sparse函数只会存储非0元素
    print("对角矩阵: {}".format(matrix))
    print(" sparse存储的矩阵: {}".format(sparse_matrix))
     
    结果:

    显示的结果:将对角矩阵中的数值为1点的位置(x,y)输出

    pandas
    生成类似excel格式的数据表,还可以对数据表进行修改操作,还可以从多种类的数据库中提取数据
    还支持在不同的列中使用不同类型的数据
    import pandas
    data = {
    "name":["jike","kime","mike"],
    "age":["1","2","3"],
    "height":["12","13","14"]
    }
    data_frame = pandas.DataFrame(data)
    display(data_frame)
    会得到一个数据表:

    还可以查询:
    display(data_frame[data_frame.name != "mike"])
     

    数据可视化

    %matplotlib inline
    #激活maplotlib
    import matplotlib.pyplot as plt
    #先生成一个-20到20,元素数是10的等差数列
    x = np.linspace(-20,20,10)
    y = x**3 + 2*x**2+6*x + 5
    #画出曲线
    plt.plot(x,y,marker = "o")
     
     

    代码开头的%matplotlib inline,允许jupyter notebook进行内置实时绘图
    如果不写,需要在最后一行plt.show() 才会将图形显示出来
  • 相关阅读:
    CodeBlocks背景主题的设置
    Win7更改默认打开方式失败
    BAT命令介绍【转自Internet】
    Index of my articles
    一个表格说明RelativeLayout中的几个重要属性【Written By KillerLegend】
    有史以来最简单的三层实例(C#) ——转载自CSDN
    银联规定的MAC算法_转载
    Windows下ORACLE 10g安装与操作图解
    Oracle 在64位机器上使用PLSQL连接Oracle的问题(SQL * NET not properly installed)转载
    Linux系统下JDK和Tomcat安装配置
  • 原文地址:https://www.cnblogs.com/expedition/p/10706995.html
Copyright © 2011-2022 走看看