本周任务:
一、python基础的准备
1、安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。
2、基本库的安装,如numpy、pandas、scipy、matplotlib
二、本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=1
1、P4 Python基础
(1)强制转换问题
(2)arange和range的区别
(3)logspace
(4)设置pycharm控制台输出长度
(5)二维数组去重问题
二维数组直接采用Unique去重会先将二维数组变成一维数组再进行去重,不符合需求。故,
方法一:转换为虚数再进行去重。
方法二:将二维数组转化为元组再放入集合中
(6)堆叠np.stack(),根据axis不同堆叠效果不同。
(7)矩阵相乘 ≠ a*b
矩阵乘法
对应元素相乘
2、P1 机器学习概论
(1)概念:机器学习是AI的一个分支,设计一个计算机系统,根据提供的数据按一定方式学习,随着训练次数增加,可以在性能上不断学习和改进,通过参数优化学习模型。
【×】大数据存储/并行计算/机器人
(2)分类:机器学习包括有监督学习,无监督学习和增强学习(9’38)
有监督学习——通过已有数据对(x,y)判断新数据(x)的y值。
·例子:儿童经过多次训练学到月亮这个概念,之后能够判断某事物是否为月亮。
无监督学习——判断不完全独立的数据之间的关系,p(x)p(y)≠p(xy)。(聚类)
·例子:词库经过训练组合得到新词,根据词语组合的概率得到新词。
(3)作用:1)清洗数据/特征选择;2)确定算法模型/参数优化;3)结果预测 (21’00)
(4)传统算法和机器学习
【区别】做某些规则时采用传统算法;运用某些规则则是机器学习。
(5)多元线性回归模型:构建一个根据多个影响因素预测到的值无限接近实际值的模型。
(6)无限迭代使得损失函数(目标函数)最低,模型达到最优。
(7)机器学习的一般流程:数据收集→数据清洗→特征工程(特征选择、调参)→数据建模→预测(37’39)
【注】清洗和特征工程实际工作量较大
(8)机器学习方法:
1)利用各种算法对数据进行分类
Linear SVM / RBF SVM / Decision Tree / Naive Bayes / Linear Discrimination / QDA / AdaBoast / Random Forest等
2)采用不同的可延展的配置文件训练模型
3)适当调整损失函数使预测数据达到最优
4)设计模型的大小适应不同设备
* 泰勒公式——预测ex的值 / 考察Gini系数的图像(梯度下降法)
* Γ函数
* 凸函数
* Soft-max 回归
* 古典概型——生日悖论 / 装箱问题 → 熵(混乱程度的反映——决策树、随机森林)
总结:什么是机器学习?有什么分类
(1)概念:机器学习是让计算机从较多的数据中提取出有用的信息,最后拥有决策判别的能力。
(2)分类
· 监督学习:其特点是在训练模型时明确标记每个数据点的正确结果,以便找它们之间的关系,确保在引入未分配的数据点时,可以正确的做出预测或分类。如在对股票价格的研究中,分析数据点之间的关系,可以用回归学习算法对下个数据点做出预测。
· 无监督学习:该类学习的特征是算法在训练模型时期不对结果进行标记,而直接在数据点之间找有意义的关系,它的价值在于发现模式以及相关性。如,一个喜欢这瓶酒的人也喜欢这一个。
· 强化学习:这种类型的学习是有监督学习和无监督学习的结合。它通常用于解决更复杂的问题。在实践中,该类学习类型可应用于控制机器人手臂、找到最有效的电机组合、机器人导航等领域。同时逻辑游戏也很适合强化学习如扑克等。强化学习的其他应用在物流、日程安排和任务的战略规划中也很常见。