zoukankan      html  css  js  c++  java
  • matplot笔记

    文件读取:

    data_train = pd.read_table('G:pythonPYprojectTitanic/train_20171215.txt',header=None,encoding='gb2312',delim_whitespace=True,index_col=0)
    #导入txt格式的数据

    #header=None:没有每列的column name,可以自己设定
    #encoding='gb2312':其他编码中文显示错误
    #delim_whitespace=True:用空格来分隔每行的数据
    #index_col=0:设置第1列数据作为index

    train = pd.read_csv('G:pythonPYprojectHouse Prices/train.csv')

    #读取csv文件

    ******************************************************************************

    plt.scatter(data_train.Survived, data_train.Age)

    #plt.scatte()用法:http://blog.csdn.net/qiu931110/article/details/68130199

    **********************************************************************************

    fig = plt.figure()
    fig.set_figheight(6)
    fig.set_figwidth(12)
    ax1 = fig.add_subplot(1, 2, 1)
    ax2 = fig.add_subplot(1, 2, 2)
    ax1.hist(train.SalePrice)
    ax2.hist(np.log1p(train.SalePrice))

    #画直方图,明白条形图和直方图的区别,直方图中包含出现频率信息,总的面积为1,np.log1p()为球对数

    ****************************************************************************************************************************

    Pandas所支持的数据类型: 
    1. float 
    2. int 
    3. bool 
    4. datetime64[ns] 
    5. datetime64[ns, tz] 
    6. timedelta[ns] 
    7. category 
    8. object 
    默认的数据类型是int64,float64.

    ************************************************

    train.drop(['date','day_of_week'],axis=1).groupby('brand').mean()

    #数据的聚合操作,删除'date','day_of_week',两列,以brand为基础进行聚合求均值。

    *******************************************************************

     pandas学习:

    1.series类型,类似于一维数组的对象,series的子浮窗表现形式为:索引在左边,值在右边。

    如创建series类型的实力为obj,则obj有两个属性,分别为obj.values和obj.index。

    2.DataFrame是一个表格类型的数据结构。每列是不同的值类型,DataFrame既有行索引也有列索引,它可以看做series组成的字典

  • 相关阅读:
    linux-Windows文件上传Linux
    linux-ifconfig 查看没有IP
    springBoot 发布war/jar包到tomcat(idea)
    linux-常用命令
    (转)JVM各种内存溢出是否产生dump
    数据库缓存的几种方式
    使用jprofiler分析dump文件一个实例
    Hibernate之一级缓存和二级缓存
    最佳实践 缓存穿透,瞬间并发,缓存雪崩的解决方法
    缓存与数据库一致性之三:缓存穿透、缓存雪崩、key重建方案
  • 原文地址:https://www.cnblogs.com/smartwhite/p/8372314.html
Copyright © 2011-2022 走看看