import numpy as np import pandas as pd # pandas 主要是用来进行数据处理的库, # 里面不仅包含了数据处理、甚至还有 统计分析、相关计算,其内部封装了numpy 相关组件 # numpy 核心 ---多维数组-ndarray # pandas 要做数据处理---也有承载 # 结构三种形式---- # series ---一维结构(了解) ----2 # dataframe ----二维结构(重点)----1 # pannel---三维结构(知道)-- # # 加载数据 # res = np.load("./国民经济核算季度数据.npz", allow_pickle=True) # # # 获取数据 # columns = res['columns'] # values = res['values'] # # print("columns: ", columns) # print("values: ", values) # 数组拼接 # data = np.concatenate(([columns],values),axis=0) # print(data) # print("*"*50) # 如何将 数组 -->转化成 我们想要的 比较好看的行列 结构 # 如何将数组 转化为 dataframe # df 相对于数组 多了 行索引 与列索引 # 可以自己指定 列索引columns # 也可以指定行索引 index # index =["index_"+ str(i) for i in np.arange(69)] # # df = pd.DataFrame(values,columns=columns,index=index) # # print(df) # print(type(df)) # # print("*"*50) # 如何将df ---》转化为series # series 只有行索引,没有列索引 # series 只是dataframe 取一列数据的特殊情况 # se = df['时间'] # # print(se) # # print(type(se)) # 自己生成一个df # d = {'col1': [0,1,2], 'col2': [1,2,3],'col3': [1,2,3]} # # df = pd.DataFrame(data=d,index=['h','g','k']) # print(df) # print(type(df)) # # print("*"*50) # # 拿取多列 # res = df[['col1','col2']] # print(res) # print(type(res)) # 自己生成一个series # se = pd.Series([1, 2, 3],index=['k','l','o']) # # print(se) # print(type(se))