zoukankan      html  css  js  c++  java
  • SCWS中文分词,词典词性标注详解

    SCWS中文分词词典条目多达26万条之巨,在整理的时候已经把很多明显不对的标注或词条清理了

    ---- 附北大词性标注版本 ----
    Ag
    形语素
    形容词性语素。形容词代码为a,语素代码g前面置以A。

    a
    形容词
    取英语形容词adjective的第1个字母。

    ad
    副形词
    直接作状语的形容词。形容词代码a和副词代码d并在一起。

    an
    名形词
    具有名词功能的形容词。形容词代码a和名词代码n并在一起。

    b
    区别词
    取汉字“别”的声母。

    c
    连词
    取英语连词conjunction的第1个字母。

    Dg
    副语素
    副词性语素。副词代码为d,语素代码g前面置以D。

    d
    副词
    取adverb的第2个字母,因其第1个字母已用于形容词。

    e
    叹词
    取英语叹词exclamation的第1个字母。

    f
    方位词
    取汉字“方”

    g
    语素
    绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。

    h
    前接成分
    取英语head的第1个字母。

    i
    成语
    取英语成语idiom的第1个字母。

    j
    简称略语
    取汉字“简”的声母。

    k
    后接成分
     
    l
    习用语
    习用语尚未成为成语,有点“临时性”,取“临”的声母。

    m
    数词
    取英语numeral的第3个字母,n,u已有他用。

    Ng
    名语素
    名词性语素。名词代码为n,语素代码g前面置以N。

    n
    名词
    取英语名词noun的第1个字母。

    nr
    人名
    名词代码n和“人(ren)”的声母并在一起。

    ns
    地名
    名词代码n和处所词代码s并在一起。

    nt
    机构团体
    “团”的声母为t,名词代码n和t并在一起。

    nz
    其他专名
    “专”的声母的第1个字母为z,名词代码n和z并在一起。

    o
    拟声词
    取英语拟声词onomatopoeia的第1个字母。

    ba 介词 把、将  
    bei 介词 被  
    p
    介词
    取英语介词prepositional的第1个字母。

    q
    量词
    取英语quantity的第1个字母。

    r
    代词
    取英语代词pronoun的第2个字母,因p已用于介词。

    s
    处所词
    取英语space的第1个字母。

    Tg
    时语素
    时间词性语素。时间词代码为t,在语素的代码g前面置以T。

    t
    时间词
    取英语time的第1个字母。

    dec 助词 的、之  
    deg 助词 得  
    di 助词 地  
    etc 助词 等、等等  
    as 助词 了、着、过  
    msp 助词 所  
    u
    其他助词
    取英语助词auxiliary

    Vg
    动语素
    动词性语素。动词代码为v。在语素的代码g前面置以V。

    v
    动词
    取英语动词verb的第一个字母。

    vd
    副动词
    直接作状语的动词。动词和副词的代码并在一起。

    vn
    名动词
    指具有名词功能的动词。动词和名词的代码并在一起。

    w
    其他标点符号
     
    x
    非语素字
    非语素字只是一个符号,字母x通常用于代表未知数、符号。

    y
    语气词
    取汉字“语”的声母。

    z
    状态词
    取汉字“状”的声母的前一个字母。

  • 相关阅读:
    设计模式之工厂方法3
    Orchard CMS中如何打包不带源码的模块
    Dump Checking
    认识WinDbg
    Bootstrap3.0学习第九轮(CSS补充)
    SVN版本冲突解决详解
    windbg Symbol file path
    SVN下错误集锦
    MvcMovieStore mvc5.0,EF6.01
    SQL Server中的窗口函数
  • 原文地址:https://www.cnblogs.com/martinzhang/p/3209727.html
Copyright © 2011-2022 走看看