这周开始解除了机器学习中分类算法
标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)
数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析)
整个开发流程:收集数据——准备数据——分析数据——训练算法——测试算法——使用算法
开发流程:
收集数据:收集样本数据
准备数据:注意样本格式
分析数据:为了确保数据集中是否存在垃圾数据。(若存在算法可处理的数据格式或可信任的数据源,则可以跳过该步骤;另外该步骤需要人工干预,会降低自动化系统价值)
训练算法:无监督算法无目标变量,可跳过该步骤
测试算法:评估算法效果
使用算法:将机器学习算饭转化为应用程序