PCFG:是基于概率的上下文无关文法,PCFG的规则表示为A—>α p,A为非终结符,p为A推导出α的概率,相同左部的产生式概率分布满足归一化条件。
基于PCFG的句法分析模型中,假设满足以下三个条件:
1.位置不变性:子树的概率不依赖子树所管辖的单词在句子中位置;
2.上下文无关性:子树的概率不依赖子树控制单词以外的单词;
3.祖先无关性:子树的概率不依赖推导出子树的祖先节点。
PCFG三个基本问题(与HMM类似):
a.给定一个句子W = w1w2wn和文法G,如何快速计算P(W|G)?
b.给定一个句子W = w1w2wn和文法G,选择句法结构树 t 使得在W的所有结构树中有最大概率?
c.给定一个句子W = w1w2wn和文法G,如何调节G的概率参数,使得句子的概率最大?即求解argMAXGP(W|G)。
为解决这三个问题,通常只考虑文法具有乔姆斯基范式的情况,对于任意一个CFG,都可以将其转化为CNF文法。