什么是机器学习?
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测.
机器学习工作流程总结:
1.获取数据
2.数据基本处理
3.特征工程
4.机器学习(模型训练)
5.模型评估
结果达到要求,上线服务
没有达到要求,重新上面步骤
获取到的数据集介绍【掌握】
1. 数据集中一行数据一般称为一个样本,一列数据一般称为一个特征。
2.数据集的构成:
3.由特征值+目标值(部分数据集没有)构成
4.为了模型的训练和测试,把数据集分为:
5.训练数据(70%-80%)和测试数据(20%-30%)
特征工程包含内容【了解】
特征提取
特征预处理
特征降维
matplotlib
import matplotlib.pyplot as plt
from pylab import mpl
# 设置显示中文字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]
# 设置正常显示符号
mpl.rcParams["axes.unicode_minus"] = False