这样会认为class 1 ,class 2 接近,有某种关系
但实际没有,那么multiple class 没有好的结果
理想的方法
下面计算各个概率
D:维度。下面的D=2
最大似然估计
每一个高斯分布都有可能产生这79个点
上面标明,结果不好。那么进行修改model
协方差矩阵与feature size 的平方成正比
model参数多,variance 就会大,那么容易过拟合
故意用一个协方差矩阵,则需要less feature
u1,u2的计算和之前算的一样,如u1 : x1......x79的均值
修改后准确率提高了
总结需要下面3步
Sigmod 函数
下面是数学公式变形
N1:class 1 占有的数目
其实z=wx+b
w:vector b:const