zoukankan      html  css  js  c++  java
  • MIT自然语言处理第一讲:简介和概述(第一部分)

    MIT自然语言处理第一讲:简介和概述(第一部分)

    自然语言处理:背景和概述
    Natural Language Processing:Background and Overview
    作者:Regina Barzilay(MIT,EECS Department,September 8, 2004)
    译者:我爱自然语言处理www.52nlp.cn ,2009年1月3日)

    这堂课将要回答的问题(Questions that today’s class will answer):
    1、什么是自然语言处理(What is Natural Language Processing (NLP))?
    2、为什么自然语言处理比较难(Why NLP is hard)?
    3、我们能够构建一个可以从文本中学习的程序吗?(Can we build programs that learn from text)?
    4、这门课程将包含哪些内容(What will this course be about)?

    一、 什么是自然语言处理(What is Natural Language Processing)?

    1、计算机将自然语言作为输入或输出:
      图略……
      输入对应的是自然语言理解(NLU: Natural Language Understanding);
      输出对应的是自然语言生成(NLG: Natural Language Generation);
    2、关于NLP的多种观点:
      A、人类语言处理的计算模型(Computational models of human language processing):
      ——程序内部按人类行为方式操作(Programs that operate internally the way humans do)
      B、 人类交流的计算模型(Computational models of human communication):
      ——程序像人类一样交互(Programs that interact like humans)
      C、有效处理文本和语音的计算系统(Computational systems that efficiently process text and speech)
    3、NLP的应用(NLP Applications):
      A、“宝贝鱼”机器翻译(Machine Translation with Babel Fish)…….
      B、MIT翻译系统(MIT Translation System)……
      C、文本摘要(Text Summarization)……
      D、对话系统(Dialogue Systems)……
      E、其他应用(Other NLP Applications):
      ——语法检查(Grammar Checking)
      ——情绪分类(Sentiment Classification)
      ——ETS作文评分(ETS Essay Scoring)

    二、 为什么自然语言处理比较难(Why NLP is hard)?
    1、 歧义(Ambiguity)
     “At last, a computer that understands you like your mother”
    对于这句话的理解:
      A、 它理解你就像你的母亲理解你一样(It understands you as well as your mother understands you);
      B、 它理解你喜欢你的母亲(It understands (that) you like your mother);
      C、 它理解你就像理解你的母亲一样(It understands you as well as it understands your mother)
      D、 我们来看看Google的翻译:最后,一台计算机能够理解你喜欢你的母亲(译者附加上去的,看上去Google的理解更像B)。
     A到C这三种理解好还是不好呢?(1 and 3: Does this mean well, or poorly?)
    2、 不同层次的歧义(Ambiguity at Many Levels)
      A、 声音层次的歧义——语音识别(At the acoustic level -speech recognition):
      ——“ … a computer that understands you like your mother”
      ——“ … a computer that understands you lie cured mother”
      B、 句法层次的歧义(At the syntactic level):
       图略
       不同的结构导致不同的解释(Different structures lead to different interpretations)
       更多的句法歧义例子(More Syntactic Ambiguity)…….图略
      C、 语义(意义)层次的歧义(At the semantic (meaning) level):
       Two definitions of “mother”:
       ——a woman who has given birth to a child
       ——a stringy slimy substance consisting of yeast cells and bacteria; is added to cider or wine to produce vinegar
       这是一个词义歧义的例子(This is an instance of word sense ambiguity)
       更多的词义歧义例子:
        ——They put money in the bank
         = buried in mud?
        ——I saw her duck with a telescope
      D、话语(多语)层次的歧义(At the discourse (multi-clause) level):
      ——Alice says they’ve built a computer that understands you like your mother
      ——But she …
       … doesn’t know any details
       … doesn’t understand me at all
       This is an instance of anaphora, where she co-referees to some other discourse entity

     附:课程及课件pdf下载MIT英文网页地址:
       http://people.csail.mit.edu/regina/6881/

    注:本文遵照麻省理工学院开放式课程创作共享规范翻译发布,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

  • 相关阅读:
    windows 2008 r2 开启互访和网络发现
    uchome 模拟发布动态和通知遇到的问题
    远程无法连接win2003的mssql2000服务器
    cidaemon.exe进程占用CPU资源的解决办法
    asp.net如何生成图片验证码
    SQL Server中截取日期型字段的日期部分和时间部分
    刷新项目失败。无法从服务器中检索文件夹信息。
    CS0016: 未能写入输出文件“c:\WINDOWS\Microsoft.NET\***.dll”错误处理
    Computer Browser服务启动后自动停止
    FCK使用 体会
  • 原文地址:https://www.cnblogs.com/renly/p/2849859.html
Copyright © 2011-2022 走看看