zoukankan      html  css  js  c++  java
  • Python模块简介及安装 [numpy,pandas,matplotlib,scipy,statsmodels,Gensim,sklearn,keras]

    https://pan.baidu.com/s/1bpVv3Ef  67bd          模块安装文件下载地址

    pip install "numpy-1.12.0b+mkl-cp35-cp35m-win_amd64.whl"   注意 安装带mkl的包

    pip install pandas

    matplotlib

    statsmodels (使用这种方式并没有正确的安装成功

    首先更新了vc++ 的各种版本 ,然后参照的这篇文章 https://blog.csdn.net/EaShion1994/article/details/56671269。安装成功

    最后发现,其实这种方法适用于各种安装不成功的情况

    Gensim

    import numpy
    #创建数组
    x=numpy.array(["a","b","9","8"])#一维数组
    y=numpy.array([[3,4,8,1],[2,3,6,11],[9,3,0,6]])#二维数组
    x[2]#9
    y[1][2]#6
    x.sort()#排序sort()  array(['8', '9', 'a', 'b'])
    y1=y.max()#取最大值 11
    y2=y.min()#取最小值 0
    #切片
    x1=x[1:3]#array(['9','a'])
    x2=x[:2]#array['8','9'])
    x3=x[1:]#array(['9','a','b'])
    numpy数组操作
    import pandas as pda
    #Series 某一串数字
    a=pda.Series([8,9,2,1])
    b=pda.Series([8,9,2,1],index=["one","two","three","four"]) #指定索引
    #DataFrame 数据框
    d=pda.DataFrame([[5,6,2,3],[8,4,5,3],[13,76,23,91]],columns=["one","two","three","four"]#指定列名
    e=pda.DataFrame({  #根据字典形式创建,按列创建
        "one":4,#如果下面有3个数字,那么补全为[4,4,4]
        "two":[6,2,3,],
        "three":list(str(982))#将一串字符串转化为3个元素
        })
    d.head(2) #取前几行,默认取前5行
    d.tail(2) #尾部数据,默认后5行
    d.describle()#统计
    d.T #转置 行变成列,列变成行
    pandas 基本操作
    import pandas as pda
    #导入csv
    i=pda.read_csv("c:/路径")
    i.describe()
    i.sort_values(by="第一列的值")#例如第一列是1,2,3,4 。如果按4排序就是by=4
    
    #导入excel
    j=pda.read_excel("c:/路径")
    
    #导入mysql中的数据
    import pymysql
    conn=pymysql.connect("host=127.0.0.1",user="root",passwd="root",db="db_name")
    sql="select * from db_name"
    k=pda.read_sql(sql,conn);
    
    #加载html 中的 表格read_html(),首先安装html5lib,beautifulsoup4
    o=pda.read_html()#可以是本地的html文件,也可以是网址,会读取其中的table标签的内容
    
    #倒入文本的数据
    pda.read_table("c:/路径")
    Python 数据导入[csv,excel,mysql,html,文本]
    #折线图/散点图 plot
    import matplotlib.pylab as pyl
    import numpy as npy
    x=[1,2,3,4,8]
    y=[5,7,2,1,5]
    pyl.plot(x,y,"o")#plot(x轴数据,y轴数据,展现形式)
    pyl.title("图表名")#图表名
    pyl.ylable("y轴的名")#y轴的名
    pyl.xlable("x轴的名")#x轴的名
    pyl.xlim(0,20)#x轴的范围
    pyl.ylim(0,15)#y轴的范围
    #显示两个图表
    x2=[8,4,2,11,15,22]
    y2=[5,32,0,6,12,16]
    pyl.plot(x2,y2)#这样就可以显示两个线了
    pyl.show()
    '''
    第三个参数可以同时添加的
    pyl.plot(x,y,"oy")
    #颜色
    c-cyan--青色
    r-red--红色
    m-magente--品红
    g-green--绿色
    b-blue--蓝色
    y-yello--黄色
    k-black--黑色
    w-white--白色
    
    #线条
    pyl.plot(x,y,"--")
    - 直线
    -- 虚线
    -. -.的形式
    : 细小虚线
    
    #点的样式
    pyl.plot(x,y,"*")
    s-- 方形
    h-- 六角形
    H-- 另一种六角形
    *-- 星型
    + -- 加号
    x-- x型
    d-- 细薄菱形
    D-- 正常菱形
    p-- 五角形
    '''
    matplotlib基础[折线图,散点图,直方图]
    #随机数的生成
    import numpy as npy
    npy.random.rndom_integers()#生产随机数(最小值,最大值,个数)
    
    #具有 正态分布 的随机数
    #正太分布,越接近平均值的地方,数量越大
    npy.random.normal(5,0,10)#参数(均数,西格玛,个数)
    
    #直方图hist
    data3=npy.random.normal(10.0,1.0,1000)
    pyl.hist(data3)#建立直方图
    sty=npy.arange(2,17,4)#2到17的范围  每个宽度为4
    pyl.hist(data3,sty,histtype='stepfilled')#(数据,样式,取消了直方图轮廓)
    pyl.show()#显示直方图
    随机数+直方图
    #在同一个图片内绘制多个图片
    pyl.subplot(2,2,3)#(拆成多少行,拆成多少列,当前区域) 2行2列第三个区域
    pyl.show()
  • 相关阅读:
    failed to load the jni shared library jvm
    记一个简单的保护if 的sh脚本
    linux添加自定义的命令!
    fc-san
    DDN
    Everything search syntax
    启动 Apache2.2 的问题
    tomcat4 请求的处理——初步分析
    404 Not Found !
    浏览器 的 session 如何保持?!
  • 原文地址:https://www.cnblogs.com/zhaoyang-1989/p/8308385.html
Copyright © 2011-2022 走看看