该部分内容主要介绍本体建模的几种方法,主要从以下几个方面介绍:
1.本体的意义
2.本体构建的几种方法
1.本体的含义
本体是指一种"形式化的,对于共享概念体系的明确而又详细的说明"。 本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系。
2. 本体构建的几种方法
本体构建主要有以下三种方式:手工构建本体,复用已有本体,自动构建本体
一. 手工构建方法
本体构建工程中比较有名的几种方法包括TOVE 法、Methontology方法、骨架法、IDEF-5法和七步法等,这都是手工构建方法,上述方法常用的依次为七步法、Methontology方法、IDEF-5法、TOVE法、骨架法。
下面会详细对七步法进行讲解:
七步法,主要用于领域本体的构建。
① 确定本体的专业领域和范畴;
在建立本体前必须先确定本体将覆盖的专业领域、范围和应用目标,建立本体之前一定要明确本体建立的领域和应用目标。
② 考查复用现有本体的可能性;
本体的主要作用就是解决知识的共享和重用问题。所以在设计和建立自己的领域本体之前,应该考虑重用已经存在的本体。
③ 列出本体中的重要术语;
首先要列举出该领域中的所有概念以及对该概念的详细解释。除此之外,针对每个概念,要列出它所有可能的属性,每个属性都有对应的属性值。
④ 定义类和类的等级体系(完善等级体系可行的方法有:自顶向下法、自低向上法和综合法[7]);
自顶向下的方式是通过本体编辑器预先构建本体,他依赖从媒资百科和结构化数据得到的高质量知识中所提取的模式信息.
自底向上的方式,则是通过各种实体和关系的抽取技术。将置信度高的模式合并到知识图谱中. ⑤定义类的属性;
⑥定义属性的分面;
建立领域概念的分类关系后,将分类概念的属性值添加到分类概念中
⑦ 创建实例。
手工构建本体可以采用protege工具进行构建。
二. 复用已有本体
复用已有本体主要有基于叙词表的领域本体构建和基于顶层本体构建领域本体的构建方法。
其中基于叙词表的领域本体构建方法如下图所示:
基于顶层本体开发领域本体的指导方法。该方法从本体工程方法论的成熟度和领域本体构建的特点出发,借鉴了骨架法和七步法,并融合了叙词表和顶层本体资源,对概念体系的规范化校验和本体的标准化处理提出了具体的方法和步骤。 研究方法的核心思想是, 从本体工程的基本思想出发, 借助词表法对选词进行规范化处理, 并选择合适的顶层本体, 对领域本体构建进行标准化处理, 最后将领域本体嫁接入顶层本体中。
基于顶层本体构建领域本体的构建方法如下图所示:
三. 自动构建本体
自动构建本体是目前的一个研究热点。研究者借鉴知识获取的相关技术,有基于自然语言规则的方法和基于统计分析的机器学习方法。
1. 实体并列关系相似度计算
2. 实体上下位关系抽取
3. 本体的生成
首先运用相似度计算,计算出不同实体之间的相似度,然后通过第二步确定这些实体之间的关系,确定是并行的关系还是上下级关系等,最后通过结合上面判定的关系进行本体构建。
以上是对本体构建的几种方法进行了介绍,目前大多数本体构建方法采用的是手工构建的方法。