zoukankan      html  css  js  c++  java
  • [NLP] 语义网络与知识图谱入门(一)

    语义网络与知识图谱入门(一)

    RDF/XML

    本体:一种形式化的对于共享概念体系明确而又详细的说明。就是指一种抽象的模型,可以用来描述对象类型、属性以及关系类型所构成的世界。

    RDF/XML主要讲的就是如何用XML的方式来表示RDF的图。

    椭圆表示节点,矩形表示文本,弧表示谓语。

    节点描述

    <rdf:Description rdf:about="A"></rdf:Description>
    

    一个节点本身需要被rdf:Description来定义,通过rdf:about来说明资源uri。

    前面rdf是空间名字,固有空间默认为rdf空间。

    属性描述

    如何描述A的属性d的值为D呢?

    属性描述
    <rdf:Description rdf:about="A">
        <d>D</d>
    </rdf:Description>
    
    简写
    <rdf:Description rdf:about="A" d="D"></rdf:Description>
    

    路径描述

    如何描述A到B的路径呢?

    可以通过定义rdf:nodeId的方式指定唯一的nodeId,也可以通过rdf:parseType为Resouce来指定空节点。

    属性描述,注意这里的B也是个节点,所以也需要Description
    <rdf:Description rdf:about="A">
        <a rdf:nodeId="abc"></a>
    </rdf:Description>
    <rdf:Description rdf:nodeId="abc">
        <b>
        	<rdf:Description rdf:about="B" ></rdf:Description>
        </b>
    </rdf:Description>
    
    不单独写空节点,即用resource
    <rdf:Description rdf:about="A">
        <a rdf:parseType="Resource">
            <b>
            	<rdf:Description rdf:about="B" ></rdf:Description>
            </b>
        </a>
    </rdf:Description>
    

    文本表示

    <?xml version="1.0"?>
    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
      xmlns:ex="http://purl.org/dc/elements/1.1/">
        <rdf:Description rdf:about="http://example.com">
        	<ex:prop rdf:parseType="Literal" xmlns:a="http://example.org/a#">
                123
            </ex:prop>
        </rdf:Description>
    </rdf:RDF>
    

    xmlns即xml namespace,定义一个命令空间。

    使用语法: xmlns:namespace-prefix="namespaceURI"。

    这里定义一个名字为a的命令空间

    可以看到解析后的结果为:

    Number Subject Predicate Object
    1 http://example.com](http://example.com/) http://purl.org/dc/elements/1.1/prop) "123"^^http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral

    解析网址:https://www.w3.org/RDF/Validator/rdfval

    通过解析可以看出来将prop指向的内容解析成了文本类型,即通过指定rdf:parseType="Literal"来实现。谓词rdf:parseType="Literal",指明节点的内容是普通文本,解释器不需要对其进行解释。

    数据类型

    可以使用rdf:datatype指定文本的数据类型

    <rdf:RDF>
        <rdf:Description rdf:about="http://example.com">
            <a rdf:datatype="http://www.w3.org/2001/XMLSchema#int">
            123
            </a>
        </rdf:Description>
    </rdf:RDF>
    

    同样的,也有string,date,decimal等数据类型可以在上面的datatype中指定。

    RDF Schema (RDFS)

    RDFS的全称为RDF Schema,RDF Schema 中的类与面向对象编程语言中的类非常相似。这就使得资源能够作为类的实例和类的子类来被定义。

    <rdf:RDF
    xmlns:rdf= "http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
    xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
    xml:base=  "http://www.animals.fake/animals#">
    
    <rdf:Description rdf:ID="animal">
      <rdf:type 
       rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
    </rdf:Description>
    
    <rdf:Description rdf:ID="horse">
      <rdf:type
       rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
      <rdfs:subClassOf rdf:resource="#animal"/>
    </rdf:Description>
    
    </rdf:RDF>
    

    rdf:type
    用来表示主语是谓语的一个实例,主语是一个资源,谓语是一个类 ,上面例子中说明animal是class的实例,horse也是class的实例。

    rdfs:subClassOf

    用来表示主语是谓语的子类,主语和谓语都是一个类 。上面例子中表明horse是animal的子类。

    rdfs:subPropertyOf

    用来表示主语是谓语的子属性,主语和谓语都是属性

    rdfs:domain

    用来表示属性的定义域

    rdfs:range

    用来表示值域

    另外,一切所有皆资源(resource):所有类(class)都是资源,所有属性(property)都是资源,所有literal都是资源。

    容器

    Open Lists

    open lists为课题添加新元素的容器。

    rdf:Seq表示一个规定为有序的值的列表(比如一个字母顺序的排序),可以包含重复值。

    rdf:Bag表示一个规定为无序的值的列表,可以包含重复值。

    rdf:Alt表示一个可替换的值的列表(用户仅可选择这些值的其中之一)。

    <rdf:RDF>
        <rdf:Description rdf:about="http://a.com">
            <a>
            	<rdf:Alt>
                     <rdf:li>CD</rdf:li>
                     <rdf:li>Record</rdf:li>
                     <rdf:li>Tape</rdf:li>
               </rdf:Alt>
            </a>
        </rdf:Description>
    </rdf:RDF>
    

    rdf:li,解释器在解释时,将自动生成编号。

    Closed Lists

    closed lists为不可以添加元素的容器,其成为collections。通过rdf:parseType="collections"可以将宾语视为closed lists。

    <rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
    xmlns:cd="http://recshop.fake/cd#">
    
    <rdf:Description
    rdf:about="http://recshop.fake/cd/Beatles">
    <cd:artist rdf:parseType="Collection">
    <rdf:Description rdf:about="http://recshop.fake/cd/Beatles/George"/>
    <rdf:Description rdf:about="http://recshop.fake/cd/Beatles/John"/>
    <rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Paul"/>
    <rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Ringo"/>
    </cd:artist>
    </rdf:Description>
    
    </rdf:RDF>
    

    Turtle语法

    turtle用三元组表示,每个句子后面一个.表示句子结束。

    前缀

    @prefix book: <http://aa.com> .
    @prefix ex: <http://axx.com> .
    

    通过@prefix来指定前缀,这样就可以在后面用这个前缀了。

    book:uri ex:a "aaa".
    
  • 相关阅读:
    python 读写XLS
    python去噪算法
    编译freetype 的dll
    python生成测试图片
    python 将pdf分页后插入至word中
    ie height
    Formview单文档或对话框项目接受不到按键消息的解决办法
    SQL SERVER配置[转]
    PyQt5 布局
    PyQt5 各种菜单实现
  • 原文地址:https://www.cnblogs.com/aoru45/p/11483330.html
Copyright © 2011-2022 走看看