zoukankan      html  css  js  c++  java
  • 【NLP CS224N笔记】Lecture 1

    I. 什么是NLP

    NLP全称是Natural Language Processing,即自然语言处理,这是一门计算机科学、人工智能以及语言学的交叉学科。

    NLP涉及的几个层次由下图所示。可以看到输入数据有两大类,分别是语音和文字。在接收到数据之后还需要做一系列的处理。

    • 首先是speech数据是做语音分析,text则是OCR或者Tokenization。
    • 之后是Morphological analysis,这是形态学的意思,援引《统计自然语言处理》中的定义:

      形态学(morphology):形态学(又称“词汇形态学”或“词法”)是语言学的一个分支,研究词的内部结构,包括屈折变化和构词法两个部分。由于词具有语音特征、句法特征和语义特征,形态学处于音位学、句法学和语义学的结合部位,所以形态学是每个语言学家都要关注的一门学科[Matthews,2000]。

    • 接下来是句法(syntactic)和语义(semantic)分析
    • 最后是对话(discource)分析,也就是说需要根据上下文对当前句子进行分析和处理。

    II. 什么是Deep Learning

    这里不做过多的赘述。需要了解机器学习基础和deep learning的可以阅读我之前的笔记:

    III. NLP相关技术

    • 1.Word Vector

    本节视频没有深入介绍,后面的内容会详细介绍。

    • 2.NLP表示层次:形态(Morphology)级别

    • 3.NLP工具:句法分析

    image.png

    还有其他的NLP技术和应用不在赘述,详细的课观看教学视频和其他笔记



    MARSGGBO原创





    2018-12-26



  • 相关阅读:
    php源码学习——开篇
    springMvc入门一
    spring 整合 servlet
    java jar包下载地址
    java spring学习
    Servlet 学习
    JRE_HOME environment variable is not defined correctly This environment variableis needed to run this program
    java JBDC操作
    Java 自定义异常
    JAVA的日期类DATE
  • 原文地址:https://www.cnblogs.com/marsggbo/p/10180044.html
Copyright © 2011-2022 走看看