简要概括,就是简单、好用!
解决问题:短语句法分析
第一步:上网址 http://code.google.com/p/berkeleyparser/downloads/list
第二步:针对自己的jdk版本和所使用语言,下载包。
e.g. jdk6 中文,那么下载 BerkeleyParser.jar for java1.6 和 chn_sm5.gr,顺便下载README看看怎么用。
第三步:准备数据测试工具否可用
新建一个文件名为 test.txt,文件中每行是分词后的结果,使用空格分隔。如“这个 姑娘 很 漂亮 。”
运行命令:java -Xmx1024m -jar berkeleyParser.jar -gr chn_sm5.gr < test.txt > out.txt
生成out.txt,内容为:( (IP (NP (DP (DT 这个)) (NP (NN 姑娘))) (VP (ADVP (AD 很)) (VP (VA 漂亮))) (PU 。)) )