zoukankan      html  css  js  c++  java
  • 数据预处理(normalize、scale)

    matlab 工具函数(三)—— normalize(归一化数据)

    注:待处理的数据 XRd×NN 表示样本的个数,d 则是单个样本的维度;

    1. 去均值(remove DC)

    X = bsxfun(@minus, X, mean(X));

    2. 截断标准差

    这里比如截断保留 +/- 3 个标准差,并 scale 至 -1/1

    xstd = 3*std(X(:));
    X = max(min(xstd, X), -xstd)/xstd;

    3. 从一个尺度空间,缩放(线性映射)到另一个尺度空间

    现考虑将 [a,b] 缩放(map/transform)到另一个尺度空间 [c,d]

    x[a,b]x=(dc)xaba+c,x[c,d]

    其中 xaba 将原始数据,缩放到 [0, 1] 区间内;

    比如将数据从 [-1, 1] 线性映射到 [0.1, 0.9] 区间:

    X = (.9-.1)*(X+1)/2+.1;

    再比如对神经网络权值矩阵的 xavier-initializer 初始化方式,服从 (-r, r) 上的均匀分布(r=6nin+nout),matlab 中的 rand() 生成的是 (0, 1) 上的均匀分布,这里如何从 (0, 1) 上的均匀分布,获取任意区间上的均匀分布((r,r)),

    xU[0,1]x010(r(r))r=x2rr

    function theta = initializeParameters(visSize, hidSize):
    r = sqrt(6/(visSize+hidSize));
    W1 = rand(hidSize, visSize)*2*r-r;
    b1 = zeros(hidSize, 1);
    theta = [W1(:); b1(:)];
    end
  • 相关阅读:
    BZOJ3689: 异或之
    BZOJ3166: [Heoi2013]Alo
    BZOJ3261: 最大异或和
    BZOJ3123: [Sdoi2013]森林
    BZOJ4520: [Cqoi2016]K远点对
    BZOJ2989: 数列
    BZOJ1941: [Sdoi2010]Hide and Seek
    BZOJ4066: 简单题
    BZOJ2648: SJY摆棋子
    KDtree模板(HDU4347)
  • 原文地址:https://www.cnblogs.com/mtcnn/p/9421853.html
Copyright © 2011-2022 走看看