步骤1、环境准备
右击桌面上选择【Open in Terminal】 打开终端。
在弹出的终端中输入【ipython】进入Python的解释器中,如图1所示。

步骤2、导入所需要的包
导入实验常用的python包。如图2所示。
【import pandas as pd】pandas用来做数据处理。
【import numpy as np】numpy用来做高维度矩阵运算.
【import matplotlib.pyplot as plt】matplotlib用来做数据可视化。

步骤3、pandas数据写入到csv文件中
创建数据,如图3所示。
【names = [‘Bob’,’Jessica’,’Mary’,’John’,’Mel’]】创建一个names列表
【 births = [968,155,77,578,973]】创建一个births 列表
【DataSet = list(zip(names,births))】用 zip 函数将这两个列表合并在一起
【DataSet】查看生成的数据
【df = pd.DataFrame(data = DataSet ,columns=[‘Names’,’Births’])】用生成的数据生成一个DataFrame对象
【df】查看生成的dataFrame


将创建的数据写入到/opt/births1880.csv文件中,如图4所示。
【df.to_csv(‘/opt/births1880.csv’, index=False, header=False )】将df写入到文件中
【ls /opt/births1880.csv】查看文件是否存在
【cat /opt/births1880.csv】查看文件内容

步骤4、pandas读取csv中的数据
读取步骤3生成的数据,如图5所示。
【local_data = r’/opt/births1880.csv’】将文件路径赋到变量local_data中
【df2 = pd.read_csv(local_data,header=None)】读取内容赋值到df2
【df2】查看df2的值
【 df3 = pd.read_csv(local_data,header=None,names=[‘names’,’births’])】指定列名字赋值到df3
【df3】查看df3的值

