自组织竞争神经网络（SOM）之向量归一化

zoukankan html css js c++ java

自组织竞争神经网络（SOM）之向量归一化

      之前的想法似乎有一定的问题，今天做一个全面的补充与更正。

    考虑一个样本矩阵，行向量表示样本的三个特征。显然我们即将向SOM网络中投入两个样本向量进行训练。那么此时，我们需要归一化的是哪部分呢？

        结合具体问题，可以考虑到如下两种情况：

        1.样本与样本之间因计算等问题产生了不必要的差别。即，我们更想关注的是不同样本的三个特征之间的差距，如对（1,4,2）而言，我们需要的信息是它们之间这种“单位量，4倍单位量，2倍单位量”的特征信息，在计算过程中我们希望它在意义上等价于一个（2,8,4）的向量，那么我们则需对每个行向量进行归一化；

        2.样本各特征之间因计算等问题产生了不必要的差别。即，我们希望各特征之间没有权重差别，但计算时却不可避免的产生了数值缩放，导致了权重的变化，如对（4,0）^T和（2,0）^T而言，我们不关注这种4与2之间两倍的差别，则可利用归一化让其成为两个（1,0）^T的向量，只关注不同样本之间特征的差别。为了得到没有特征权重影响的各样本，我们需对每个列向量进行归一化。

      首先可以肯定的是，输入向量全部需要归一化。具体要采取哪一种归一化方式，还是取决于应用环境。如选择采取第一种归一化方式，那么神经网络也要保证在每次参与运算前进行归一化。即，对于网络训练过程来说，输入一个向量，归一化后与每个结点自带权值进行比较，比较前结点权值明显需要归一化，比较后，在调整域内改变各结点权值，此时参与调整运算的输入向量和结点权值自身，都必须是已归一化处理的。而调整后，明显权值又不是单位向量了，此时并不用着急进行归一化，因为下次比较前还有机会处理。对于分类过程中的各向量而言，同样，比较前进行归一化即可。所以各个地方都不要遗漏。

      若采取第二种归一化方式，那么我们可以在样本向量变化的范围内随机生成网络各结点权值。而此时，拥有不同权值的结点蕴含不同的特征信息，所以不需要对网络结点权值进行归一化。

      至于向量归一化的原理，可参考http://blog.sina.com.cn/s/blog_66a6172c0102v3em.html。讲真，实验完成后发现，归一化和未归一化的结果差距还真是挺明显的。



查看全文

相关阅读:
CF 444B(DZY Loves FFT-时间复杂度)
摆弄【Nhibernate 协会制图--导乐陪伴分娩】
固定的报文统计报告的规定
 CSS——（2）与标准流盒模型
 自动复制转换StringBuffer
IM信息网
 Oracle Redo Log
【转载】有哪些省时小技巧，是每个Linux用户都应该知道的
 Linux snmp
MySQL zabbix

原文地址：https://www.cnblogs.com/4114s/p/5149485.html