zoukankan      html  css  js  c++  java
  • 知识图谱学习笔记(1)

    知识图谱(Knowledge Graph kg)

    --------------------------------

      1.KG概念的演化

    语义网络--->本体论--->Web--->the semantic Web--->链接数据--->知识图谱

      2.KG辅助搜索

     Web的理想是万物的链接,搜索的理想是事物的搜索,搜索的理想是事物的搜索

        3.KG辅助问答

      机器人以及loT设备的只能化:给万物都挂接一个知识背景库,对话式的获取更加需要精准度和可靠度,知识图谱对于提升用户体验更加必不可少

    知识图谱(Knowage Graph,kg)
    -----------------------------------------------
    0.KG概念演化
    语义网络(1960)--->本体论(1980)--->Web(1989)--->The Semantic Web(1998)--->链接数据(2006)--->知识图谱(2006)
    在这个过程中,人工智能研究者陆续提出了大量的知识表示方法,如框架系统、产生式规则、逻辑描述等
    知识图谱得益于Web的发展(更多的是数据层面),有着来源于KR、NLP、Web、AI等多个方面的基因

    语义网:从链接文本到链接数据
    谷歌知识图谱:Things not strings

    1.KG辅助搜索:Web的理想是万物的链接,搜索的理想是事物的搜索
    2.KG辅助问答:机器人以及loT设备的智能化,给万物都挂接一个背景知识库,对话式的信息获取更加需要提高精准度和可靠度,知识图谱对于用户体验的提升不可缺少
    3.KG辅助决策:
    4.KG辅助AI:常识的推理
    当一个人听到一句话的时候,他使用自己所有的知识和智能去理解。这不仅包括语法,也包括它的词汇知识、上下文知识,更重要的,是对相关事务的理解

    5.KG本质
    ------------------------------------
    Web视角:像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义
    nlp视角:怎么从文本中抽取语义和结构化数据
    KR视角:怎么利用计算机符号来表示和处理知识
    AI视角:怎么利用知识库来辅助理解人的语言
    DB视角:用图的方式存储知识
    做好KG要兼容并蓄,综合利用好KR、NLP、Web、ML、DB等多方面的方法和技术

    6.各种知识图谱的项目。
    6.1CYC
    (1)CYC是在1984年由Douglas Lenat开始创建。最初的目的是建立人类最大的常识知识库。典型的常识知识如"Every tree is a plant","Plant die eventaully"等等
    (2)CYC知识库主要由术语Terms和断言Assertions组成。Terms包含概念、关系和实体的定义。Assertions用来建立Terms之间的关系,这既包括了事实Fact描述,也包含了规则Rule的描述
    (3)最新的CYC知识库包含了50万条Terms和700万条Assertions。CYC的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但是过于形式化也会导致
    知识库的扩展性和应用的灵活性不够。CYC提供开放版本OpenCyc.
    6.2Wordnet
    (1)Wordnet是最著名的词典知识库,主要用于词义的消歧
    (2)Wordnet组要定义了名词、动词、形容词和副词之间的语义关系。例如名词之间的上下位关系(如:“猫科动物”是“猫”的上位词),动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等
    (3)Wordnet3.0已经包含了15万个词和20万个语义关系
    6.3zhishi.
    6.4cnSchema:开放的中文知识图谱,
    6.1cnSchema.org是一个基于社区维护的开放的知识图谱Schema标准。cnSchema分类,数据类型的词汇集包括了上千种概念pes、属性和关系等常用概念定义,以支持只是土偶的通用性、复用性和流动性
    6.2结合中文的特点。我们复用、链接并扩展了Schema.org,Wikidata,Wikidata等已有的知识图谱Schema标准,为中文领域的开放知识图谱、聊天汲取人、搜索引擎的优化等提供了参考和扩展的数据描述和接口的定义标准
    7.指示图的技术体系


    KG Data更加规范的数据表达,更强的数据关联,主要急速包括:知识抽取,知识表示,知识问答,语义搜索,可视化,知识链接,知识推理,只是众包以及知识融合等。
    8.RDF:Triple based Assertion modle知识表示三元组

    Subject(主语)---Predicate(谓语)--->Object(宾语)
    如:人工智能之父是图灵

    9.SPARQL简介:
    RDF的查询语言:基于RDF数据模型
    可以对不同的数据集撰写复杂的连接
    由所有主流的图数据库支持

    Select ? name
    WHERE{
    ?m <bornln> ?city. ?m <hasName> ?name.
    ?m<bornOnData> ?bd. ?city <foundingYear> ''1718''.
    FILTER(regix(str(?bd),''1976''))
    }
    10.JSON-LD:数据格式交换
    入语义数据和Resful Web Service
    {
    "@context":"http://json-ld.org/contexts/person.jsonld",
    "@id":"http://dbpedia.org/resource/john_Lenon"
    "name":"John Lennon",
    "born":"1940-10-09"
    "spouse":"http://dbpedia.org/resource/Cynthia_Lenon"


    }
    11.知识图谱的分布式表示-KG Embedding:在保留语义的同时,将知识图谱中的实体和关系映射到连续的稠密的低维向量空间

    第二部分:典型案例的简介

  • 相关阅读:
    高盛、沃尔玛 题做出来还挂了的吐槽
    amazon师兄debrief
    到所有人家距离之和最短的中点 296. Best Meeting Point
    问问题没人回答的情况怎么办终于有解了
    找名人 277. Find the Celebrity
    数组生存游戏 289. Game of Life
    547. Number of Provinces 省份数量
    428. Serialize and Deserialize Nary Tree 序列化、反序列化n叉树
    alias别名简介和使用
    面试官:线程池执行过程中遇到异常会发生什么,怎样处理? Vincent
  • 原文地址:https://www.cnblogs.com/bigdata-stone/p/9606590.html
Copyright © 2011-2022 走看看