Atitit 语义网的实现技术
目录
2.1. 第1层:基础层,主要包含Unicode和URI(Uniform resource identifier) 4
2.3. 第3层:资源描述框架,主要包括RDF及相关规范。 4
2.4. 第4层:本体层,即定义本体(Ontology)。该层在RDF的基础上定义了RDFS(RDF Schema)和OWL(Web Ontology Language) 4
2.5. 第5至7层分别是逻辑层(Logic)、验证层(Proof)、信任层(Trust)。 4
4. 关键技术 三大技术的支持,即XML、RDF和Ontology 5
5.1. 在RDFS/OWL之上,W3C还定义了规则互换格式(rule interchange format,RIF)和SWRL(Semantic Web Rule Language)来辅助推理。 6
5.2. RIF,规则语言 (rule interchange format,RIF 6
5.3. SWRL(Semantic Web Rule Language) 6
5.5. 语义API是随着语义网的发展而发展的,这类网络服务以非结构化的文本作为输入,输出一些实体与关系。 6
6. Atitit 微格式microformats艾提拉总结 6
8. 基于语义网的应用,如通用及垂直搜索引擎、文本助理工具、个人信息管理系统、 7
摘要:语义网是现有万维网的变革与延伸,是Web of documents向Web of data的转变。它的目标是让计算机可以像人脑一样理解信息的含义,从而完成智能代理的功能。本文对语义网结构、相关技术、规范做了简要的综述,分析
语义网是一种使用可以被计算机理解的方式描述事物的网络,它的基本思想就是让机器或者设备能够自动识别和理解万维网上的内容,自动化地处理、集成来自不同数据源的数据[3],使得Web信息获取更为智能便捷。
尽管Web上存在海量的信息,但是当前的Web实际上只是一种面向人的存储和共享信息的媒介[4]。Web上的内容是提供给人而不是机器本身来理解和浏览的。由于Web内容没有采用形式化的表示方式,并且缺乏明确的语义信息,故而计算机“看到的”Web内容只是普通的二进制数据,对其内容无法进行识别。如果机器不能充分理解网页内容的含义,就无法实现Web内容的自动处理。
考虑到当前Web存在的上述问题,Berners-Lee提出了语义网。顾名思义,语义网是对现有Web增加了语义支持,它是现有万维网的延伸与变革,其目标是帮助机器在一定程度上理解Web信息的含义,使得高效的信息共享和机器智能协同成为可能。语义网将会为用户提供动态、主动的服务,从而更便于机器和机器、人和机器之间的对话及协同工作。简言之,语义网就是以Web数据的内容,即数据的语义为核心,用机器能够理解和处理的方式链接起来的海量分布式数据库
语义网(Semantic Web)的核心是:通过给万维网上的文档(如: HTML)增加能够被计算机所理解的语义(Meta data),从而使整个互联网成为一个通用的信息交换媒介。换言之,就是构建一个能够实现人与电脑无障碍沟通的智能网络。打破现阶段万维网面向文档、信息孤岛等问题
---------------------
体系结构
Berners-Lee提出了最初的语义网体系结构[5],随着人们对语义网的深入研究,语义网的体系结构也在不断地发展演变。图2-1给出了语义Web的体系结构,各层的功能自下而上逐渐增强。
---------------------
。XML是SGML(标准通用标记语言)的一个子集,它以一种自我描述的方式定义数据结构。在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的联系[4]。用户可以在XML中自由地定义标记名称及元素的层次结构。为了便于程序或其他用户能够正确处理用户定义的内容,XML还定义了命名空间(Name Space)和XML模式规范(XML Schema)以提供更好地XML文档服务。
RDF是一种用于描述WWW上资源信息的通用框架,比如网页的内容、作者以及被创建和修改的日期等。RDF[7]本质上是一种数据模型,用主体(subject)、谓词或属性(predicate或property)、客体或属性值(object或property value)所构成的三元组来描述资源的元数据[8]。RDF也可以用于表达其它元数据,例如分子的结构、图书的书目信息等。正因为RDF的灵活性,它成为了诸如生物、化学等许多领域表达元数据的基本方法[11]。可以说,RDF已经成为知识表达的通用形式。如果把XML看成一种标准的元数据语法规范的话,那么RDF就可以看做一种标准的元数据语义描述规范。
帮助用户构建应用领域相关的轻量级的本体。RDFS和OWL定义了语义,可以支持机器在用RDFS和OWL描述的知识库和本体中进行推理[4],以达到语义网的目标。
逻辑层在前面各层的基础上进行逻辑推理操作。验证层根据逻辑陈述进行验证,以得出结论。信任层是语义网安全的组成部分,与加密不同的是,该层主要负责发布语义网所能支持的信任评估[4]。目前第6层和第7层正处于设想阶段
---------------------
Rss
从图2-1不难看出,实现语义网需要三大技术的支持,即XML、RDF和Ontology。其中XML层作为句法层,RDF层作为数据层,Ontology层作为语义层。
OWL弥补了RDFS的不足,运用人工智能(Artificial intelligence,AI)中的逻辑来赋予语义,支持多种形式的推理。在表达概念的语义灵活性、Web内容的机器可理解性等方面OWL比早前的XML、RDF、RDF-S等语言都要强。
其中RIF支持在不同的规则格式里互操作
---------------------
SPARQL可用于查询任何基于RDF的数据(也就是说,包括那些涉及到RDFS和OWL的声明)。要从语义网应用程序那里检索信息,查询语言是不可或缺的要素。
例如路透社的Open Calais API,这项服务接受原始文本的输入,返回
目录
1.1. 微格式microformats(vCard(电子名片)和iCalendar hcard hCalendar 1
1.2. RSS 2
1.3. 微格式包括hAtom、hCard、Geo、hCalendar等。 2
1.4. hCard 微格式 3
1.5. Microdata (HTML5) 3
1.6. Poshformat POSH,POSH是Plain Old Semantic HTML的缩写, 4
1.7. 另外一个概念就是FreeFormat,在语义标注方面poshformat的理念和FreeFormat是相通的 4
– 一个在HTML5被提出的功能,增强微格式可用性
Microdata 可以作为语义网的实现技术,当然还有其他的实现技术,比如 Microformats、RDF 等,有兴趣的读者可以阅读参考资料中的资源。
知识管理这个领域,有个分支叫语义网,这两年就改了名字叫知识图谱
- 现在语义网领域已经改名叫知识图谱,下面说的内容对知识图谱也都是适用的
语义浏览工具等等,但在它们为大众所接受之前,还有很长的路要走。即便这些技术成功了,用户也不会有兴趣知道那背后使用了些什么技术。所以说在用户层面推广语义网技术是没什么前景的。
用户也不会有兴趣知道那背后使用了些什么技术。所以说在用户层面推广语义网技术是没什么前景的。
企业就不一样了,第一,企业比较习惯于技术方面的论调,对于它们来说,利用语义技术可以增加产品的智能程度,从而形成市场价值。“我们的产品更好更聪明,因为我们使用语义网”,听起来这对企业来说是一个很不错的宣传。
从企业层面来说,RDF解决了数据的互通性标准的问题。这个问题其实在软件行业的早期便已出现,你可以忘掉语义网,只把它看作是一个标准协议,一个使得两个程序可以互通信息的标准。这对企业来说无疑是极具价值的
(5条消息)语义网简介(非应用) - 咸鱼的小站 - CSDN博客.html
从语义网到知识图谱——语义技术工程化的回顾与反思 – 文因互联.html