学了机器学习,进一步理解到 机器学习方法=模型+策略+算法 三要素构成, 最近在做A/Btest 涉及假设检验,发现也可以用 模型+策略+算法 三要素来理解整个过程。回顾以前在学校里参加过多次数学建模竞赛经验,其实现实中的很多业务量化模型都可以归结为这个三个要素思路求解过程。
因此,这里对这个很好的三要素 模型求解思路做个小结归纳。
机器学习方法三要素:模型+策略+算法
step1、模型
就是对一个实际业务问题进行结构化和量化,将其转化为一个可以用数学函数等来量化表达的问题。如线性回归、时间序列、罗辑回归…
step2、策略
建模后,数学模型中一定会涉及一些未知的系数参数,那么它们到底该取什么值呢?此时就想到用损失函数(风险函数)来描述预测值与理论值之间的差距,将其转化为一个使损失函数最小化的优化问题,这就是一种策略思路。
step3、算法
指的是求解最优化问题的具体数学方法。我们一般将其转化为无约束优化问题,然后利用“梯度下降法”和“牛顿法”等进行求解。
引申:那么,假设检验三要素是什么?
模型——>假设检验是小概率反证法思想:即如果按照原假设抽样样本来自于某个已知总体,即抽样样本所在的总体均值等于某个已知总体均值u =u0 。根据中心极限定理,样本均值应该会落在该已知总体均值两侧的某个区间内,即样本均值不会大于或小于该区间。1、建立原假设和备择假设 2、给定检验水平,选择检验方法并计算检验统计量 3、比较检验统计量和检验水平,做出判断结论
策略——>那么这个参照区间应该是多少呢?由于每个总体均值大小不一,对应的均值两侧的区间范围也不一样,同样此时就想到都进行标准化,引入标准正态分布某个大概率区间(标准临界值)来做参照系,然后将样本均值标准化后看是否落在给定的临界区间。
算法——>Z检验、t检验等检验统计量函数就是对样本均值进行标准化的具体数学方法