Document of Dictionaries
10 Minutes to pandas
tutorialspoint
import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)
print df
Name Age
0 Alex 10.0
1 Bob 12.0
2 Clarke 13.0
Series 和 DataFrame 的创建
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
s = pd.Series([1, 2, 5, np.nan, 6, 8]) # 类似于 numpy 的 array 不过是一维的,仅限一维哦
# print(s)
# 0 1.0
# 1 2.0
# 2 5.0
# 3 NaN # not a number 表示无穷或者非数值
# 4 6.0
# 5 8.0
# dtype: float64
dates = pd.date_range('20180116', periods=3) # 创建 16 17 18 等 3 个日期,待会儿作为行
df = pd.DataFrame(np.random.randn(3,4), index=dates, columns=list('ABCD')) # 这是二维的,类似于一个表!
# 通过 numpy 随机了一个 3 * 4 的数据,这和行数、列数是相对应的
# print(df)
# A B C D
# 2018-01-16 -0.139759 0.857653 0.754470 0.224313
# 2018-01-17 1.565070 0.521973 -1.265168 -0.278524
# 2018-01-18 -0.668574 -0.527155 0.877785 -1.123334
# 直接通过一个字典也是可以创建 dataFrame 的。
df2 = pd.DataFrame({'A' : 1.,
'B' : pd.Timestamp('20130102'),
'C' : pd.Series(1,index=list(range(4)),dtype='float32'),
'D' : np.array([3] * 4,dtype='int32'),
'E' : pd.Categorical(["test","train","test","train"]),
'F' : 'foo' })
# print(df2)
# A B C D E F
# 0 1.0 2013-01-02 1.0 3 test foo
# 1 1.0 2013-01-02 1.0 3 train foo
# 2 1.0 2013-01-02 1.0 3 test foo
# 3 1.0 2013-01-02 1.0 3 train foo
# 取得具体的类型
# print(df2.dtypes)
# A float64
# B datetime64[ns]
# C float32
# D int32
# E category
# F object
# dtype: object