zoukankan      html  css  js  c++  java
  • 熵的理解(玻尔兹曼分布)

    • log2n(以 2 为底的对数):用二进制数来表达不同的状态组合需要多少个二进制位;

    0. 玻尔兹曼分布

    网络中任意两个状态出现的概率与对应能量之间的关系:

    P(α)P(β)=exp(E0/T)exp(E1/T)

    从式中可以得出两点结论,

    • (1)BM 网络处于某一状态(P(x=α))下的概率主要取决于此状态下的能量 Eα,能量越低,出现的概率越大;
    • (2)BM 网络处于某一状态的概率还取决于温度参数 T,温度越高,不同状态出现的概率越接近,网络能量也较易跳出局部最小而搜索全局最小,
      • 温度低时,则情况相反;

    1. 物理的解释

    一个密封系统中,装有许多气体粒子(分子),共有 N 个粒子(由于是密封,不会增加也不会减少),假设系统内部的温度为 T,系统内的分子有两种状态,ϵ0,ϵ1(前者表示低能量的状态,后者表示高能量的状态),处在 ϵ0 能级上的粒子有 n0 个,处在 ϵ1 能及上的粒子有 n1 个,显然一个永远满足的等式即为:

    n0+n1=N

    N 个粒子,存在 n0ϵ0n1ϵ1这种分布的组合数(状态数)记为 W,则 W=(n0N)=(n1N)=N!n0!n1!

    此时我们来计算系统的熵(与系统可能的状态数有关):

    S=klog2W=klog2(N!n0!n1!)=k(log2N!log2n0!log2n1!)

    k 称为玻尔兹曼机常数,W 为状态数。一些时刻之后向系统内施加一部分能量 ϵ,有一粒子从低能级跃迁至高能级,n0=1,n1+=1,则新状态下的熵为:

    S=klog2W=klog2(N!(n01)!(n1+1)!)=k(log2N!log2(n01)!log2(n1+1)!)

    所以有系统能量的变化为:

    ΔS=SS=klog2n0n1+1klog2n0n1

    近似的原因在于,分子的数量是相当大的。由热力学的相关定理可知,

    ΔS=ϵT=klnn0n1

    进一步可得出:

    n0n1=eϵ/kT

    这样的一个分布情况,就是玻尔兹曼分布

  • 相关阅读:
    python3笔记二十二:正则表达式之函数
    python3笔记二十一:时间操作datetime和calendar
    python3笔记二十:时间操作time
    python3笔记十七:python文件读写
    Spring常用注解
    Pytorch实现卷积神经网络CNN
    Keras实现autoencoder
    Keras实现LSTM
    TensorFlow实现CNN
    Recurrent Neural Networks vs LSTM
  • 原文地址:https://www.cnblogs.com/mtcnn/p/9422846.html
Copyright © 2011-2022 走看看