相对熵与交叉熵 - 走看看

zoukankan html css js c++ java

相对熵与交叉熵

转载自：https://www.zhihu.com/question/41252833/answer/141598211

　　仅从机器学习的角度讨论这个问题。

　　相对熵（relative entropy）就是KL散度（Kullback–Leibler divergence），用于衡量两个概率分布之间的差异。

　　对于两个概率分布和，其相对熵的计算公式为：

（）

注意：由于和在公式中的地位不是相等的，所以

　　相对熵的特点，是只有时，其值为0。若和略有差异，其值就会大于0。其证明利用了负对数函数（）是严格凸函数（strictly convex function）的性质。具体可以参考PRML 1.6.1 Relative entropy and mutual information.

　　相对熵公式的前半部分就是交叉熵（cross entropy）。

　　若是数据的真实概率分布，是由数据计算得到的概率分布。机器学习的目的就是希望尽可能地逼近甚至等于，从而使得相对熵接近最小值0. 由于真实的概率分布是固定的，相对熵公式的后半部分就成了一个常数。那么相对熵达到最小值的时候，也意味着交叉熵达到了最小值。对的优化就等效于求交叉熵的最小值。另外，对交叉熵求最小值，也等效于求最大似然估计（maximum likelihood estimation）。具体可以参考Deep Learning 5.5 Maximum Likelihood Estimation.

查看全文

相关阅读:
rabbitmq 学习
 linux下安装rabbitmq 集群
 excel中将时间戳转换为日期格式
 python实现批量修改服务器密码
 python 根据字典的键值进行排序
 python字符串的拼接
 python的变量
 python基础1
【性能分析】使用Intel VTune Amplifier
【vim】搜索与替换

原文地址：https://www.cnblogs.com/hejunlin1992/p/8257484.html

Copyright © 2011-2022 走看看