zoukankan      html  css  js  c++  java
  • MIT自然语言处理第一讲:简介和概述(第一部分)

    MIT自然语言处理第一讲:简介和概述(第一部分)

    自然语言处理:背景和概述
    Natural Language Processing:Background and Overview
    作者:Regina Barzilay(MIT,EECS Department,September 8, 2004)
    译者:我爱自然语言处理www.52nlp.cn ,2009年1月3日)

    这堂课将要回答的问题(Questions that today’s class will answer):
    1、什么是自然语言处理(What is Natural Language Processing (NLP))?
    2、为什么自然语言处理比较难(Why NLP is hard)?
    3、我们能够构建一个可以从文本中学习的程序吗?(Can we build programs that learn from text)?
    4、这门课程将包含哪些内容(What will this course be about)?

    一、 什么是自然语言处理(What is Natural Language Processing)?

    1、计算机将自然语言作为输入或输出:
      图略……
      输入对应的是自然语言理解(NLU: Natural Language Understanding);
      输出对应的是自然语言生成(NLG: Natural Language Generation);
    2、关于NLP的多种观点:
      A、人类语言处理的计算模型(Computational models of human language processing):
      ——程序内部按人类行为方式操作(Programs that operate internally the way humans do)
      B、 人类交流的计算模型(Computational models of human communication):
      ——程序像人类一样交互(Programs that interact like humans)
      C、有效处理文本和语音的计算系统(Computational systems that efficiently process text and speech)
    3、NLP的应用(NLP Applications):
      A、“宝贝鱼”机器翻译(Machine Translation with Babel Fish)…….
      B、MIT翻译系统(MIT Translation System)……
      C、文本摘要(Text Summarization)……
      D、对话系统(Dialogue Systems)……
      E、其他应用(Other NLP Applications):
      ——语法检查(Grammar Checking)
      ——情绪分类(Sentiment Classification)
      ——ETS作文评分(ETS Essay Scoring)

    二、 为什么自然语言处理比较难(Why NLP is hard)?
    1、 歧义(Ambiguity)
     “At last, a computer that understands you like your mother”
    对于这句话的理解:
      A、 它理解你就像你的母亲理解你一样(It understands you as well as your mother understands you);
      B、 它理解你喜欢你的母亲(It understands (that) you like your mother);
      C、 它理解你就像理解你的母亲一样(It understands you as well as it understands your mother)
      D、 我们来看看Google的翻译:最后,一台计算机能够理解你喜欢你的母亲(译者附加上去的,看上去Google的理解更像B)。
     A到C这三种理解好还是不好呢?(1 and 3: Does this mean well, or poorly?)
    2、 不同层次的歧义(Ambiguity at Many Levels)
      A、 声音层次的歧义——语音识别(At the acoustic level -speech recognition):
      ——“ … a computer that understands you like your mother”
      ——“ … a computer that understands you lie cured mother”
      B、 句法层次的歧义(At the syntactic level):
       图略
       不同的结构导致不同的解释(Different structures lead to different interpretations)
       更多的句法歧义例子(More Syntactic Ambiguity)…….图略
      C、 语义(意义)层次的歧义(At the semantic (meaning) level):
       Two definitions of “mother”:
       ——a woman who has given birth to a child
       ——a stringy slimy substance consisting of yeast cells and bacteria; is added to cider or wine to produce vinegar
       这是一个词义歧义的例子(This is an instance of word sense ambiguity)
       更多的词义歧义例子:
        ——They put money in the bank
         = buried in mud?
        ——I saw her duck with a telescope
      D、话语(多语)层次的歧义(At the discourse (multi-clause) level):
      ——Alice says they’ve built a computer that understands you like your mother
      ——But she …
       … doesn’t know any details
       … doesn’t understand me at all
       This is an instance of anaphora, where she co-referees to some other discourse entity

     附:课程及课件pdf下载MIT英文网页地址:
       http://people.csail.mit.edu/regina/6881/

    注:本文遵照麻省理工学院开放式课程创作共享规范翻译发布,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

  • 相关阅读:
    mysql千万级数据量根据索引优化查询速度
    Centos 7 开放查看端口 防火墙关闭打开
    Spring-Quartz 配置执行时间参数
    Curl命令查看请求响应时间
    Centos 7 安装 Mongodb
    配置Docker加速器
    TCP端口状态说明ESTABLISHED、TIME_WAIT
    Maven依赖项Scope属性设置含义
    实战JAVA虚拟机 JVM故障诊断与性能优化(十)---字节码的执行
    代理模式(Proxy)_java实现
  • 原文地址:https://www.cnblogs.com/renly/p/2849859.html
Copyright © 2011-2022 走看看