与 LDA 假设不同,BTM 模型假设每个biterm 中的两个词汇均是采样于一个主题 z,而每个主题是关于词汇的多项式分布。该模型示意图如下
BTM 于LDA的不同在于,LDA是document-level,BTM是corpus-level,LDA 计算的是topic-document-word的概率分布,BTM计算的是topic-Biterm的概率分布。相同点在于,都是基于词共现,只是BTM基于word pair pattern。BTM 模型能够离散词共现。