Kernel Method

zoukankan html css js c++ java

Kernel Method

写在之前

时间充裕的话，可以从文末给出的参考链接中观看李正轩博士视频，本文是其讲课资料整理。

基本概念

设(phi)实现$R^2 ightarrow R^3 $的映射，即

[(x_1, x_2) ightarrow (z_1, z_2,z_3) = (x_1^2,sqrt{x_1x_2},x_2^2) ]
对于数据分布按照(frac{x_1^2}{a^2}+frac{x_2^2}{b^2}= 1)，映射之后有：(frac{1}{a^2}z_1+0·z_2+frac{1}{b^2}z_3= 1)

数据的分割从椭圆变成了3维的平面。

由此，(phi)可以实现低维到高维的映射，并可以线性划分。来看高维度的几何性质：

[<phi(x_1,x_2), phi(x_1',x_2')>= <(x_1^2,sqrt{x_1x_2},x_2^2)(x_1'^2,sqrt{x_1'x_2'},x_2'^2)> \=(x_1x_1'+x_2x_2')^2 = <x, x'>^2 = kappa(x, x') ]
[cos( heta) = frac{<phi(x), phi(x')>}{||phi(x)|| ·||phi(x')||} = frac{kappa(x, x')}{sqrt{kappa (x, x)}sqrt{kappa (x', x')}} ]
(kappa(x, x'))是核函数，实现了高纬度内积降维到低维，然后掉用Kernel function就可以。仅仅是(kappa)就可以描述高维空间中的性质，而不需要知道(phi)具体是如何映射的。

简单的分类器

训练集${(x_1, y_1), ...(x_n, y_n)} in R^d imes {-1, 1} ightarrow {(phi(x_1), y_1), ...(phi(x_n), y_n)} in H imes {-1, 1} $

正样本中心点：(c_+ =frac{1}{m_+} sum_{{i|y_i = +1}} {phi(x_i)})
负样本中心点：(c_- =frac{1}{m_-} sum_{{i|y_i = -1}} {phi(x_i)})

中心点差向量：(w = c_+-c_-)
中心点：(c= frac{1}{2}(c_++c_-))

判断正类样本： (cos( heta) > 0 ightarrow <phi(x)-c, w> >0)
判断负类样本：(cos( heta) < 0 ightarrow <phi(x)-c, w> <0)
即(egin{align}y = sgn(<phi(x)-c, w>)end{align})

因为(phi)还不清楚，所以以上判断还需进一步化简，

[<phi(x)-c, w> = w^T(phi(x)-c) = w^T phi(x)- w^Tc \ = {(c_+-c_-)}^T phi(x) - frac{1}{2}{(c_+-c_-)}^T(c_++c_-) \ egin{align}= (frac{1}{m_+} sum_{{i|y_i = +1}} {kappa(x, x_i)}- frac{1}{m_-} sum_{{i|y_i = -1}} {kappa(x, x_i)}) - b \ end{align}]

(phi)并不是一定要求出来，只要知道Kernel Function 就行。Kernel Function 需要满足有限半正定(finitely positive semi-definite)。对于给定的(phi)，可以求出(kappa)计算特征空间的点积；对于给定的(kappa)，可以找到一个(phi)构建特征空间H。

Dual Representation

设特征空间的线性函数为(f(x) = w^T phi(x)+b)，为了去掉(phi)，由(3)需要进一步化简

[f(x) =( sum_{i=1}^N alpha_i kappa(x_i, x)) +b ]
其中 (w = c_+-c_- =...=sum_{i=1}^N alpha_i phi(x_i))

从这里看，使用(kappa)将原本(phi(x))的高维向量的内积变成了低维内积，然后做一次kernel function。大大减少了计算量。

参考文献

[1]https://www.youtube.com/watch?v=p4t6O9uRX-U&index=1&list=PLt0SBi1p7xrRKE2us8doqryRou6eDYEOy

查看全文

相关阅读:
（数据科学学习手札48）Scala中的函数式编程
 Java中的集合(十三) 实现Map接口的Hashtable
Java中的集合(十二) 实现Map接口的WeakHashMap
Java中的集合(十一) 实现Map接口的TreeMap
Java集合（十）实现Map接口的HashMap
Java集合（九）哈希冲突及解决哈希冲突的4种方式
 Java集合（八）哈希表及哈希函数的实现方式
 Java中的集合（七）双列集合顶层接口------Map接口架构
 Java中的集合（六）继承Collection的Set接口
 Java中的集合（五）继承Collection的List接口

原文地址：https://www.cnblogs.com/hainingwyx/p/6835954.html

写在之前

基本概念

简单的分类器

Dual Representation

参考文献