zoukankan      html  css  js  c++  java
  • 《自然语言理解(Natural Language Understanding)》(2016-03-17)阅读笔记

    原文链接:https://yq.aliyun.com/articles/8301
    作者:李永彬
    发布时间:2016-03-17 16:37:47

    • 自然语言理解(Natural Language Understanding,NLU)以语言学为基础,融合逻辑学、心理学和计算机科学等学科,试图解决以下问题:语言究竟是怎样组织起来传输信息的?人又是怎样从一连串的语言符号中获取信息的?换种表达就是,通过语法、语义、语用的分析,获取自然语言的语义表示。

      自然语言理解的结果,就是要获得一个语义表示(semantic representation):
    • 分布语义,Distributional semantics:这种方法的优点在于,它完全是数据驱动的方法,并且能够很好的表示语义,但一个很大的缺点在于,它的表示结果是一个整体,没有进一步的子结构。
    • 框架语义,Frame semantics:这种方法和distributional semantics相比,能够表达丰富的结构。
    • 模型论语义,Model-theoretic semantics: 这种方法的典型框架是把自然语言映射成逻辑表达式(logic form),是对世界知识的完整表示,比前两种方法表达的语义更加完整,但是缺点是semantic parser的构建比较困难,这大大限制了该方法的应用。
    • 我们目前采用的是frame semantics表示的一种变形:采用领域(domain)、意图(intent)和属性槽(slots)来表示语义结果。领域分类和意图分类对应frame identification,属性抽取对应argument identification。

    面临挑战
    -(1)如何构建知识库
    -(2)如何理解用户语句的意图
    - 东三环堵吗/下水道堵吗;今天的天气/今天的天气不错;附近哪可以喝咖啡呀/感冒了可以喝咖啡吗
    -(3)如何构建可扩展的算法框架
    - 一个可扩展的算法框架,每当修改或者新增某个领域的时候,不会对其他领域造成干扰。
    -(4)如何构建数据驱动的计算流程
    -(5)如何融入上下文知识

    • 支持常见的数十个领域的理解
    • 一套可扩展的算法框架
    • 数据驱动的闭环流程
  • 相关阅读:
    PAT 1063 计算谱半径(20)(代码)
    PAT 1071 小赌怡情(15)(代码)
    PAT 1068 万绿丛中一点红(20)(测试点分析+思路分析)
    PAT 甲级 1011 World Cup Betting (20)(代码+思路)
    PAT 1041 考试座位号(15)(代码)
    PAT 1076 Wifi密码(15)(代码)
    Mvc全局过滤器与Action排除
    .NET Core WebApi使用Swagger
    .NET WebApi使用Swagger
    JQuery常见方法
  • 原文地址:https://www.cnblogs.com/CheeseZH/p/12023020.html
Copyright © 2011-2022 走看看