zoukankan      html  css  js  c++  java
  • 机器学习笔记3向量参数+feature scaling and mean normalization

    多特征变量的处理:依旧是一维的,是向量的积,并且是从0开始的X(x0,x1,...,xn),此处x0=1,为了配合f(x0,...,xn)=d0*x0+d1*x1+...+dn*xn;显然就是D点乘X。这对应之前的拟合公式,但显然是多维的,不过想象成2维就够了。每一个数据组合是一个x向量加它对应的y值,一共有m个数据组合,而x向量的维数假设是n。

    所以有了关于整体方差函数的公式:1/2m*{[f(x0(1),..,xn(1))]^2-y1(x0,..,xn)+[f()-y2()]^2+...}也就是说自变量是一组向量。我觉得自己分开写能更容易理解。

    下面说下处理的技巧:

    首先是数值的放缩,尽量乘以一个系数使x向量中的元素取值范围在-1~1之间。比方说房子的大小10000平最大,那么乘以0.0001即可。另外还有平移操作,也就是x-p,比方原始是1~5那么就减去3变成-2~2,再除以2变成-1~1。这些其实都是对方差函数图像进行均匀操作,使其能够对称均匀,从而更快得到最后的平静。所以就有某个元素(x-p)*j.其实就是做一个变量代换。所以不影响结果。但是他的幻灯片是先找到系数,再找位移,这就导致了1~5个卧室,定下系数5,再定下位移2。并且定义位移是平均值,我不知道是指的中位数还是平均值,系数是指的范围,比方5-1.不过他说最后大概这个范围就可以,5还是4都可以。

    这就是feature scaling 和mean normalization.

    本博客专注于错误锦集,在作死的边缘试探
  • 相关阅读:
    A1066 Root of AVL Tree (25 分)
    A1099 Build A Binary Search Tree (30 分)
    A1043 Is It a Binary Search Tree (25 分) ——PA, 24/25, 先记录思路
    A1079; A1090; A1004:一般树遍历
    A1053 Path of Equal Weight (30 分)
    A1086 Tree Traversals Again (25 分)
    A1020 Tree Traversals (25 分)
    A1091 Acute Stroke (30 分)
    A1103 Integer Factorization (30 分)
    A1032 Sharing (25 分)
  • 原文地址:https://www.cnblogs.com/SweetBeens/p/6655674.html
Copyright © 2011-2022 走看看