Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。使用浏览器作为界面,向后台的IPython服务器发送请求,并显示结果。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。
IPython 是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。
安装ipython
windows: 前提是有numpy,matplotlib pandas
采用pip安装 pip install ipython
OS X: AppStore下载安装苹果开发工具Xcode。
使用easy_install或pip安装IPython,或者从源文件安装。
安装Jupyter notebook
pip3 install jupyter
数据读取与存储
读取与存储csv:
# filepath 文件路径。该字符串可以是一个URL。有效的URL方案包括http,ftp和file # sep 分隔符。read_csv默认为“,”,read_table默认为制表符“[Tab]”。 # header 接收int或sequence。表示将某行数据作为列名。默认为infer,表示自动识别。 # names 接收array。表示列名。 # index_col 表示索引列的位置,取值为sequence则代表多重索引。 # dtype 代表写入的数据类型(列名为key,数据格式为values)。 # engine 接收c或者python。代表数据解析引擎。默认为c。 # nrows 接收int。表示读取前n行。 pd.read_table( filepath_or_buffer, sep=' ', header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None) pd.read_csv( filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None)
DataFrame.to_csv(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None)
读取与存储excel:
# io 表示文件路径。 # sheetname 代表excel表内数据的分表位置。默认为0。 # header 接收int或sequence。表示将某行数据作为列名。默认为infer,表示自动识别。 # names 表示索引列的位置,取值为sequence则代表多重索引。 # index_col 表示索引列的位置,取值为sequence则代表多重索引。 # dtype 接收dict。数据类型。 pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)
DataFrame.to_excel(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None)
读取与存储JSON:
# 通过json模块转换为字典,再转换为DataFrame pd.read_json('../ratings.json')