zoukankan html css js c++ java

Sequence Classification

Natural Language Processing with Python

Charpter 6.1

 1 import nltk
 2 from nltk.corpus import brown
 3 
 4 def pos_features(sentence,i,history):
 5     features = {"suffix(1)":sentence[i][-1:],
 6                 "suffix(2)":sentence[i][-2:],
 7                 "suffix(3)":sentence[i][-3:]}
 8     if i == 0:
 9         features["prev-word"]="<STAR>"
10         features["prev_tag"] ="<STAR>"
11     else:
12         features["prev_word"]=sentence[i-1]
13         features["prev_tag"]=history[i-1]        
14     return features
15     
16 class ConsecutivePosTagger(nltk.TaggerI):
17     def __init__(self,train_sents):
18         train_set=[]
19         for tagged_sent in train_sents:
20             history=[]
21             untagged_sent = nltk.tag.untag(tagged_sent)
22             for i,(word,tag) in enumerate(tagged_sent):
23                 featureset=pos_features(untagged_sent,i,history)
24                 train_set.append((featureset,tag))
25                 history.append(tag)
26         self.classifier=nltk.NaiveBayesClassifier.train(train_set)
27         
28     def tag(self,sentence):
29         history=[]
30         for i,word in enumerate(sentence):
31             featureset=pos_features(sentence,i,history)
32             tag=self.classifier.classify(featureset)
33             history.append(tag)
34         return zip(sentence,history)
35                 
36 def test_ConsecutivePosTagger():
37     tagged_sents=brown.tagged_sents(categories='news')
38     size = int(len(tagged_sents) * 0.1)
39     train_sents, test_sents = tagged_sents[size:], tagged_sents[:size]
40     tagger = ConsecutivePosTagger(train_sents)
41     
42     print tagger.evaluate(test_sents)

流程为：

结果为：

0.796940194715

查看全文

相关阅读:
eval()一个有意思的PHP函数
 PHP error_reporting() 函数
 网络编程基础--协程--greenlet切换---gevent自动识别 IO ---
网络编程基础--多线程---concurrent.futures 模块---事件Event---信号量Semaphore---定时器Timer---死锁现象递归锁----线程队列queue
rpm -qa 查找文件
 Linux Gvim shell 创建第一个shell脚本
 centos7修改网卡名称为eth0-技术流ken
pxe+kickstart自动化批量安装系统详解-技术流ken
cobbler单台服务器实现批量自动化安装不同版本系统-技术流ken
cobbler批量安装系统使用详解-技术流ken

原文地址：https://www.cnblogs.com/gui0901/p/4453138.html