zoukankan      html  css  js  c++  java
  • 【语言处理与Python】5.7如何确定一个词的分类

    形态学线索

    从词的内部结构可能为这个词分类提供有用的线索。

    例如:

    -ness与形容词结合可能是一个名词;

    -ment是与一些动词结合产生一个名词的后缀;

    英语的动词也是形态复杂的。

    例如:

    -ing有可能是现在分词、也有可能是动名词

    句法线索

    一个词可能出现的典型上下文

    例如:

    假设我们已经确定了名词类,我们可以说,英语的形容词的句法标准是可以立即出现在一个名词前,或者紧跟在be或者very的后面

    语义线索

    一个词的意思对其词汇范畴是一个有用的线索。

    新词

    比如很多的新词都是名词,这些名词属于开放类;

    介词被认为是封闭类,因为只有有限的词汇属于这个类别;

    词性标记集中的形态学

    例如有的词却有不同的形态,在更细粒度的分词上需要注意:

    形式 类别 标记
    go 基本 VB
    goes 第三人称单数 VBZ
    gone 过去分词 VBN
    going 动名词 VBG
    went 一般过去时 VBD

    总之,没有一个“正确的方式”来分配标记,只有根据目标不同或多或少有用的方法。

  • 相关阅读:
    系统集成项目管理工程师高频考点(第一章)
    2、无重复字符的最长子串
    1、爬楼梯
    webpack起步
    Centos7安装nginx
    Centos7安装nacos
    Centos7安装java和maven
    centos7安装fastDFS
    aop中获取请求消息和属性
    数据库面对高并发的思路
  • 原文地址:https://www.cnblogs.com/createMoMo/p/3100144.html
Copyright © 2011-2022 走看看