zoukankan      html  css  js  c++  java
  • UNIT对话系统(杂记)

    单轮对话指标:

      召回率=机器人能回答的问题数/问题总数

      准确率=机器人正确回答的问题数/问题总数

      问题解决率=机器成功解决的问题数/问题总数

    多轮对话指标:

      任务完成率=成功结束的多轮会话数/多轮会话总数

    格里斯准则:

      质量准则:只说确认的真实的内容

      数量准则:所说的话需要满足交流所需要的信息量,但不应该超出交流所需的信息量

      相关法则:只说和主题相关的内容

      态度准则:即说话需清晰明了,避免模棱两可

    UNIT专业术语

    BOT:

      一个BOT对应一个特定场景下独立的对话系统,用来满足特定场景下的对话理解与交互需求。通常按行业垂类划分。

    技能:

      某一方向的对话能力,分为自定义技能和系统技能。

    • 自定义技能:完全由用户配置
    • 系统技能:UNIT平台预置的通用能力,支持开发者后期干预。

      技能下包含对话意图与问答意图,即BOT拥有的技能既可以解析用户对话的对话意图,也可以实现简单的FAQ问答。

    意图:

      在一个对话任务中BOT要理解的用户目的。

      意图分为对话意图和问答意图。问答意图用于圈定某一范围或主题的问答对。

    词槽:

      满足用户对话意图的关键信息或限定条件,可以理解为用户需要提供的筛选条件。词槽一定程度上影响系统对“【动作】”这个对话意图的执行。

      词典:属于词槽的所有词汇组成词典。

    对话样本:

      用来给对话系统做示范,教它在用户说的具体句子里,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。

    对话模板:

      用来给对话系统按具体语法、句式做出示范,教他在某一特定语法、句式中,该如何理解对话意图,哪个词是重要信息,对应词槽是什么。

      对话模板也可以使用多条对话模板组成对话模板组,实现按片段去匹配用户query,实现更强的对话意图泛化匹配能力,提高模板对用户query的召回率。

    特征词:

      约束某条对话模板的匹配范围,提供一定限度的泛化能力。

      活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。

      特征词词典:开发者需自行导入词典,用于系统识别特征词。

    问答对:

    • 问题与答案的组合,称之为问答对。
    • 问答对支持一对一,一对多,多对一,多对多。
    • 当某个问题中包含多个答案,答案随机呈现。

    问答集:

    • 问答集是承载问答对的容器,与技能中问答意图的定义一一对应
    • 支持批量将问答内容导入问答集和在线编辑

    训练模型:

      把BOT下所有的配置、标注的对话样本、对话模板等打包提交给UNIT平台来训练对话理解模型,训练的时长跟训练的对话样本量、对话模板量有关系,量越多训练时间越长。训练完成后沙河环境中的BOT会自动加载并生效模型,一般几分钟。

    沙盒环境:

      沙盒环境是UNIT平台提供开发者创建BOT、训练优化BOT模型的环境。

      每个BOT都配有一个沙盒环境,将训练好的BOT模型生效到沙盒环境后,就可以进行效果验证了,同时可接入到您自己的业务系统中使用。

      可以生成多个模型版本,但只能选择一个放到沙盒环境中。

    生产环境:

      生产环境是UNIT平台在百度云上为开发者提供的可定制的稳定的对话服务环境。

    知识图谱:

      知识图谱其实就是语义网,描述真实世界中存在的各种实体或概念。它是知识的结构化表示,通常我们用一张巨大的由点和边组成的图来可视化表现知识图谱:点代表实体或概念,用全局唯一确定ID来标识,称为标识符,点包含属性,称为值对(AVP),用来刻画实体的内在特性,边代表实体间的关系,用来连接两个实体。

    情感分析:

      情感分析是指为会话赋予情感值,可根据情感值的正负将情感倾向分为正面情感、中立情感和负面情感。

      评测情感分析的指标主要为情感分类的准确率及负情感的召回率。

  • 相关阅读:
    Luogu P4716 【模板】最小树形图
    P4180 严格次小生成树[BJWC2010] Kruskal,倍增
    LA4080/UVa1416 Warfare And Logistics 最短路树
    LA4255/UVa1423 Guess 拓扑排序 并查集
    【算法竞赛入门经典—训练指南】学习笔记(含例题代码与思路)第三章:实用数据结构
    【算法竞赛入门经典—训练指南】学习笔记(含例题代码与思路)第二章:数学基础
    【算法竞赛入门经典—训练指南】学习笔记(含例题代码与思路)第一章:算法设计基础
    P4177 [CEOI2008]order 网络流,最小割,最大权闭合子图
    [USACO5.1] 乐曲主题Musical Themes
    [USACO06DEC] 牛奶模式Milk Patterns
  • 原文地址:https://www.cnblogs.com/nirvanaInSilence/p/12023101.html
Copyright © 2011-2022 走看看