机器学习当中能深入浅出的方法第一步就是先学会用numpy了。numpy是一个第三方的开源python库,他提供了许多科学的数值计算工具,尤其是大型矩阵计算,但使用配置非常简单,结合matplotlib能够非常方便的将计算结果展示成各种图形,如点状图,折线图,散点图。
先搭建开发环境,首先到 https://www.anaconda.com/download/现在 适合你自己的安装包,这里我就下载了,Anaconda 5.1 mac版,python 是 3.6。
没梯子的可以到清华大学的镜像网站去下载,草鸡快。
https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
下载安装置换后,在终端依次执行下列命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes
如果嫌 Anacoda 太大可以安装 mini版,具体参考上面链接。
安装好之后,打开 Anacoda,点击 Enviroment 如下图
图1
默认有一个root工作空间,他里面包含了大多数的包,其中numpy, matplotlib都在其中。
如果还要安装其他的包,直接点击右侧的installed, 选择 未安装(uninstall)再在右侧的输入框里输入查找想要安装的包。一般在自己新建的工作空间里,需要这样做。因为自己新建的工作空间,如图1中,我新建的Python工作空间,里面默认可能没有你需要的库,这时,你就需要自己安装了。
接下来,点击左侧导航栏的Home,看到第二个 noteBook, 这就是我们写代码的地方。
图2
点击noteBook之后进入 noteBook的目录设置页面,以后代码就放在这里了。然后新建一个python文件。进入notebook,就可以正式编码了
图3
notebook界面:和普通的记事本大部分功能很像,但是这里有个单元格的概念,单元格里相当于一个单独的作用域,可以单独运行里面的代码。
图4
上面代码有详细的注释,可以看到,代码可以把数据从电子表格读出并输入到屏幕。
图5
我们把name当做横坐标,salary当做纵坐标,设置好title,横竖坐标代表什么,然后默认 matplot就会帮我们把折线图绘制出来。是不是很简单。
图6
如果要画多个图,可以这样,需要设置有几个图,图的排布方式等。
图7
图7给出了一次画多个折线图的方法
图8
图8 给出了折线图,直方图,散点图,二维图的绘制方法,看看注释应该很好理解。