在线学习和在线凸优化（online learning and online convex optimization）—在线分类问题2

zoukankan html css js c++ java

在线学习和在线凸优化（online learning and online convex optimization）—在线分类问题2

紧接上文，我们讲述在线分类问题

令 $Y = D = { 0,1}$ ， $l(p,y) = left| {p - y} ight|$ 为0-1损失，我们做出如下的简化假设：

学习者的目标是相对于hypotheses set: H具有low regret，其中H中的每个函数是从 $chi$ 到{0,1}的映射，并且regret被定义为:

我们首先证明这是一个不可能完成的任务——如果 $left| H ight| = 2$ ，没有算法可以获得次线性regret bound。考虑 $H = left{ {{h_0},{h_1}} ight}$ ， ${h_0}$ 是一个总是返0的函数， ${h_1}$ 是一个总是返1的函数。通过简单地等待学习者的预测然后提供相反的答案作为真实答案，攻击者可以使任何在线算法的错误数等于T。相反，对于任何真实答案序列，令b为 ${y_1},...,{y_{{ m{ }}T}}$ 中的大多数标签，则 ${h_b}$ 的错误数最多为T/2。因此，任何在线算法的regret可能至少是T-T/2 =T/2，这不是T的次线性。

为了回避Cover’s impossibility result，我们进一步限制对抗环境的能力。下面展示两种方法。

　　第一种方法是增加额外的一个假设：

　　

　　接下来，我们描述和分析在线学习算法，假设有限假设类（Finite Hypothesis Class）和输入序列的可实现性（realizability）。最自然的学习规则是使用（在任何在线回合）任何与过去所有例子一致的假设。

　　　　

　　Consistent 算法维持一个与 $left( {{x_1},{y_1}} ight),...,left( {{x_{t - 1}},{y_{t - 1}}} ight)$ 一致的所有假设的集合 ${V_t}$ 。此集合通常称为version space。然后它从中选择任何假设并根据该假设进行预测。

　　Consistent 算法的mistake bound：

　　

　　Halving算法：

　　

　　Having算法的mistake bound：

　　

　　证明：

　　第二种方法是随机化（Randomization）:　　

　　如果学习机输出（ $Pleft[ {{{mathop ylimits^ wedge }_t} = 1} ight] = {p_t}$ ），则它在t回合上的期望损失是： $Pleft[ {{{mathop ylimits^ wedge }_t} e {y_t}} ight] = left| {{p_t} - {y_t}} ight|$

　　对predictions domain做改变，此时predictions domain不等于target domain：

　　

　　

　　根据这个假设，可以推导出如下定理中所述的low regret算法：

　　

　　

　　我们已经提出了两种不同的方法来回避Cover’s impossibility result： realizability 和 randomization。这两种方法似乎有些不同。然而，有一个深层的基本概念将它们连接起来。事实上，我们将证明这两种方法都可以解释为凸化技术。凸性是推导在线学习算法的中心主题，我们在下一节中进行研究。

　　未完，待续。。。。。。

　　下一节分析在线凸优化技术。

　　

查看全文

相关阅读:
第五课 golang语言变量
 【托业】【新托业TOEIC新题型真题】学习笔记9-题库七+八--P4-5
【托业】【语法题】笔记
 【托业】【新托业TOEIC新题型真题】学习笔记8-题库五->P7
【托业】【金山词霸】1-42待巩固词汇（包含首次背诵措词）
【托业】【新托业TOEIC新题型真题】学习笔记7-题库二->P1~4
【托业】【新托业TOEIC新题型真题】学习笔记5-题库二->P7
【托业】【新托业TOEIC新题型真题】学习笔记4-题库一->P7
【托业】【新托业TOEIC新题型真题】学习笔记3-题库二->P5-6
【托业】【新托业TOEIC新题型真题】学习笔记2-题库一-->P5-6

原文地址：https://www.cnblogs.com/wzdLY/p/9565906.html