linux 下的Stanford词性标注
java -mx1g -cp "/home/hadoop/stanford-corenlp-full-2017-06-09/stanford-postagger.jar:" edu.stanford.nlp.tagger.maxent.MaxentTagger -model "/home/hadoop/stanford-corenlp-full-2017-06-09/models/chinese-distsim.tagger" -textFile source.txt > result-linux.txt
win7下的Stanford 依存句法分析
java -mx150m -cp "*;" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn,typedDependencies" lexparser/chinesePCFG.ser.gz source.txt > my.txt
linux 下的Stanford 依存句法分析
java -mx150m -cp "/home/hadoop/stanford-parser-full-2017-06-09/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn,typedDependencies" lexparser/chinesePCFG.ser.gz source.txt > my.txt
(ROOT
(IP
(NP (NR 张传庆))
(VP
(ADVP (AD 曾))
(PP (P 在)
(LCP
(NP
(QP (CD 许多))
(NP (NR 中国) (NN 引水) (NN 隧洞) (NN 项目)))
(LC 中)))
(VP (VV 发挥)
(NP
(ADJP (JJ 重要))
(NP (NN 作用。)))))))
nsubj(发挥-10, 张传庆-1)
advmod(发挥-10, 曾-2)
case(项目-8, 在-3)
dep(项目-8, 许多-4)
compound:nn(项目-8, 中国-5)
compound:nn(项目-8, 引水-6)
compound:nn(项目-8, 隧洞-7)
nmod:prep(发挥-10, 项目-8)
case(项目-8, 中-9)
root(ROOT-0, 发挥-10)
amod(作用。-12, 重要-11)
dobj(发挥-10, 作用。-12)
去掉penn
java -mx150m -cp "/home/hadoop/stanford-parser-full-2017-06-09/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "typedDependencies" lexparser/chinesePCFG.ser.gz source.txt > my.txt
只显示penn
输出:
SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
Parsing file: source.txt
Parsing [sent. 1 len. 12]: 张传庆 曾 在 许多 中国 引水 隧洞 项目 中 发挥 重要 作用。
Parsed file: source.txt [1 sentences].
Parsed 12 words in 1 sentences (7.22 wds/sec; 0.60 sents/sec).
hadoop@master:~/stanford-parser-full-2017-06-09$ cat my.txt
nsubj(发挥-10, 张传庆-1)
advmod(发挥-10, 曾-2)
case(项目-8, 在-3)
dep(项目-8, 许多-4)
compound:nn(项目-8, 中国-5)
compound:nn(项目-8, 引水-6)
compound:nn(项目-8, 隧洞-7)
nmod:prep(发挥-10, 项目-8)
case(项目-8, 中-9)
root(ROOT-0, 发挥-10)
amod(作用。-12, 重要-11)
dobj(发挥-10, 作用。-12)
java -mx150m -cp "/home/hadoop/stanford-parser-full-2017-06-09/*:" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn" lexparser/chinesePCFG.ser.gz source.txt > my.txt
输出
SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
Parsing file: source.txt
Parsing [sent. 1 len. 12]: 张传庆 曾 在 许多 中国 引水 隧洞 项目 中 发挥 重要 作用。
Parsed file: source.txt [1 sentences].
Parsed 12 words in 1 sentences (20.76 wds/sec; 1.73 sents/sec).
hadoop@master:~/stanford-parser-full-2017-06-09$ cat my.txt
(ROOT
(IP
(NP (NR 张传庆))
(VP
(ADVP (AD 曾))
(PP (P 在)
(LCP
(NP
(QP (CD 许多))
(NP (NR 中国) (NN 引水) (NN 隧洞) (NN 项目)))
(LC 中)))
(VP (VV 发挥)
(NP
(ADJP (JJ 重要))
(NP (NN 作用。)))))))