机器学习(3)数据预处理|下载数据集、加载数据集、导入数据集
数据预处理步骤:
下载数据集
导入标准库
import numpy as np
# ...
导入数据集
-
设置工作路径。
-
使用Spyder加载数据集
dataset = pd.read_csv('Data.csv')
注意 :
- python的数据集是从0开始的,而R是从1开始的。
- 双击加载的数据集,可以查看详细信息。
- 修改数据显示的格式,不以科学计数法显示。
- 创建自变量的矩阵和因变量的向量。
X = dataset.iloc[:, : - 1].values # 取所有行和除去最后一列的所有列 Y = dataset.iloc[:, 3].values # 取所有行和最后一列