数据科学:R & Python
工作 & Kaggle机器学习比赛
可重复函数式编程
一、Python模块的载入
- 包 Package
- 模块 module
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
二、R语言包的载入
install.packages("ggplot2")
library(ggplot2)
require(ggplot2)
install.packages("pacman")
library(pacman)
install必须加双引号,library可以不加。
pacman包可以一次性加载多个包。
library(pacman)
p_load(tidyverse, data.table)
# 或者
pacman::p_load(tidyverse, data.table)
p_load函数可以一次性加载多个包,如果该包以前未曾安装过,会自动帮忙安装,很方便。
三、总结
Python:之所以使用pd.read_csv之类的函数是因为很多函数,很多模块,很容易就导致函数重名,因此需要说明来自哪个包;
R:主要用来解决探索性问题,代码量少,重复概率低,当然也可以使用类似pacman::p_load的方法。
END 2018-11-02 00:07:14