matplot笔记 - 走看看

zoukankan html css js c++ java

matplot笔记

文件读取：

data_train = pd.read_table('G:pythonPYprojectTitanic/train_20171215.txt',header=None,encoding='gb2312',delim_whitespace=True,index_col=0)
#导入txt格式的数据

#header=None:没有每列的column name，可以自己设定
#encoding='gb2312':其他编码中文显示错误
#delim_whitespace=True:用空格来分隔每行的数据
#index_col=0:设置第1列数据作为index

train = pd.read_csv('G:pythonPYprojectHouse Prices/train.csv')

#读取csv文件

******************************************************************************

plt.scatter(data_train.Survived, data_train.Age)

#plt.scatte（）用法：http://blog.csdn.net/qiu931110/article/details/68130199

**********************************************************************************

fig = plt.figure()
fig.set_figheight(6)
fig.set_figwidth(12)
ax1 = fig.add_subplot(1, 2, 1)
ax2 = fig.add_subplot(1, 2, 2)
ax1.hist(train.SalePrice)
ax2.hist(np.log1p(train.SalePrice))

#画直方图，明白条形图和直方图的区别，直方图中包含出现频率信息，总的面积为1，np.log1p（）为球对数

****************************************************************************************************************************

Pandas所支持的数据类型:
1. float
2. int
3. bool
4. datetime64[ns]
5. datetime64[ns, tz]
6. timedelta[ns]
7. category
8. object
默认的数据类型是int64,float64.

************************************************

train.drop(['date','day_of_week'],axis=1).groupby('brand').mean()

#数据的聚合操作，删除'date','day_of_week'，两列，以brand为基础进行聚合求均值。

*******************************************************************

pandas学习：

1.series类型，类似于一维数组的对象，series的子浮窗表现形式为：索引在左边，值在右边。

如创建series类型的实力为obj，则obj有两个属性，分别为obj.values和obj.index。

2.DataFrame是一个表格类型的数据结构。每列是不同的值类型，DataFrame既有行索引也有列索引，它可以看做series组成的字典

查看全文

相关阅读:
记录PHP的执行时间
 Mysql数据字典导出
 PHP用post来进行Soap请求
 laravel(lumen)配置读写分离后，强制读主（写）库数据库，解决主从延迟问题
 使用vagrant构建你们团队的开发环境
 Lumen框架使用Redis与框架Cache压测比较
 使用php-cs-fixer格式化你的代码
 Javascript下拉导航
 jsf2.0视频
 jsf2入门视频教程

原文地址：https://www.cnblogs.com/smartwhite/p/8372314.html