问题的提出
已知:词序列:
![](https://images0.cnblogs.com/blog/316046/201311/03110600-b775c55667ca4bd8bbdca1d58dcbadb2.png)
寻找词性序列:
![](https://images0.cnblogs.com/blog/316046/201311/03110651-cfeb3e4bb9e747f5ac52dd4c71bcafb7.png)
使得条件概率最大:
![](https://images0.cnblogs.com/blog/316046/201311/03110913-e202530476644d37b42d9faf41d74527.png)
解:(忽略词序列概率,因为没用)
![](https://images0.cnblogs.com/blog/316046/201311/03123322-cf64596166a748bfa13ddf43fed3a04a.png)
图示:
![](https://images0.cnblogs.com/blog/316046/201311/03124201-67c2ca71c9694172a2292a096dca8da0.jpg)
具体实现就是:动态规划-维特比算法 [维特比算法.....自己看吧,数学之美上有解释]
概念解释:
发射概率:某个词作为名词出现的频率/名词在语料库中出现的频率 也叫生成概率 某个隐状态生成显状态的概率
转移概率:某个词性到另一个词性的频率/某个词性生成所有其他词性的频率(也就是这个词性的频率)
初始概率:(BEMS) B/所有句子开头是BEMS的总合