本专栏当前的话题是建模、UML 和 XML。具体而言,即研究 UML 建模在 XML 开发中的应用,特别是如何用 XSLT 样式表实现自动派生。
随着 XML 成为开发项目的一种常见特性,很多开发人员对把 XML 和开发过程中的其他部分结合起来越来越感兴趣。尽管许多组织仍然依靠专门的工具进行 XML 开发,但大的趋势是在 XML 的开发中采用其他开发需求已经使用的方法论,或者至少是一组通用的工具,比如 Java 技术、数据库和 Web。
自动派生
上一期已经指出,模型是帮助计算和预测的系统简化描述。在本文的环境中,所谓系统指的都是 XML 词汇表。
图 1 表示的是模型连续体(continuum)的建模过程。第一个模型是画在白板(或者一沓纸)上的,一般不那么正规。这个阶段的目标是让所有的参与者(用户、开发人员和设计人员)有机会自由地表达自己的观点。
图 1. 模型连续体下一步是绘制一个 UML 模型(如果词汇表很复杂可能要画多个模型)。UML 模型更加精确和形式化,但仍然是综合性的和可阅读的,因为其主要目的是作为小组成员之间的交流工具。
最后一个模型是 XML 模式,这是最精确的模型。它的目标是使解析器能够针对词汇表的定义验证 XML 文档,因此在保持可读性的同时更强调精确性。
这些模型之间的主要区别在于目标不同:从非正式的交流到通过解析器进行精确的、形式化的验证。区别不在于模型的性质(XML 词汇表的简化描述),而在于模型提供的帮助层次。
既然把模型看作是从最不准确到最形式化的连续体,探讨模型的自动派生就合情合理了,即从早期模型自动生成新的模型的过程。显然,只有当两个模型具有等同的描述性时才能很好地自动派生,这和一些模型比另一些更富于描述性的观点有几分冲突。如何解决模型中的不同描述层次将在下一期讨论,现在讨论的重点是派生。
XML 元数据交换(XMI)
您也许还能记得上一期文章中,我通过 XMI 和 XSLT 实现了自动派生。假设您熟悉 XML 模式(否则请参阅参考资料),我们用这一节来介绍 XML 元数据交换(XML Metadata Interchange,XMI)。
词汇表和兼容性
XMI 是一个非常复杂的规范(1.2 版有 400 多页),本文基于实现自动派生的需要做尽可能简单的介绍。
XMI 并没有规定一种 XML 词汇表,而是定义了从元模型生成词汇表的一种算法。换句话说,XMI 没有定义 Class
、Attribute
、Association
或者其他您期望看到的标签。相反,XMI 规定了如何为元模型中的概念创建标签。当然这需要处理大量的模型,先暂时忍耐一下——您很快就会明白。
因此,与其说是词汇表,XMI 更像是一个框架。不幸的是,这意味着不同的工具会以不同的方式解释这个框架。即使同一种工具的不同版本也有差别:Rational Rose 最初通过 Unisys 开发的一个插件支持 XMI。最新版本的 Rational XDE 提供了 XMI 的内在支持,但却是一个略有不同的变体。差别尽管不一定很大,但也可能造成不兼容。在实践中,合理的做法是针对社区中使用的一两种工具设计样式表,而不必顾及其他的工具。
本文中没有采用特定的 XMI 版本,而是选择采用 OMG 发表的例子。虽然没有直接支持这些例子的工具,但作为很好的起点,针对选用的工具进行适当调整并不困难。
XMI 头
虽然 XMI 主要是规定了一种算法,但是也定义了少量的标签和属性。将要用到的包括:
XMI
一定是根元素。它必须包括xmi.version
属性(合法的版本有 1.0、1.1、1.2 和 2.0)。XMI.header
用于存放关于模型的信息。最重要的子元素有XMI.documentation
和XMI.metamodel
。XMI.documentation
保存最终用户的信息,其子元素有(这些子元素的名字含义非常明显):XMI.owner
XMI.contact
XMI.longDescription
XMI.shortDescription
XMI.exporter
XMI.exporterVersion
XMI.exporterID
XMI.notice
XMI.metamodel
记录应用 XMI 算法的元模型——在这里即 UML 元模型(XMI 也用于其他元模型,如同样由 OMG 发布的 Metaobject Facility,MOF)XMI.content
包含实际的模型。xmi.id
和xmi.idref
是用于链接的属性:xmi.id
是一个元素标识符,必须是唯一的;xmi.idref
是通过标识符对元素的因素的引用。
元模型
UML 元模型是描述 UML 语言的模型——具体而言,它描述类、属性、关联、包、协作、用况、参与者、消息、状态和 UML 语言中所有其他概念。为了保持一致性,元模型使用 UML 编写。
前缀“meta”表明元模型(metamodel)描述的是模型的模型。类似地,XML 是一种元语言,因为它是一种描述语言的语言。
UML 元模型在 UML 规范中发布。具体而言,XMI 使用 UML 规范(请参阅参考资料)第5章中所描述的“UML Model Interchange”。
要注意,UML 元模型庞大得吓人。本文中只能简略地提一提。图 2 摘自描述类的元模型,类是类图中的核心概念。
图 2. 类的元模型这个元模型中,类的概念用元类 Class 建模,后者继承自抽象元类 Classifier。Classifier 是 Class、Interface 和 Datatype 的祖先(后两者没有在图 2 中表示出来)。继承链再往上推:GeneralizableElement 代表所有可以泛化(被继承)的概念;ModelElement 代表模型中的所有抽象(如名称空间、约束和类);最后是 Element,最高层次的元类。这些元类都有 Class 继承的属性。
XMI 的变体
XMI 元素和属性( 观察元模型中的主要元素(如 Class、Attribute、Association),看看它们是如何映射到 XML 中的。如果手头上有元模型的片段会非常方便。 区别只是表面性的:似乎没有两个应用程序使用同样的名称空间。一些应用程序使用 XML 元素编码元模型中的属性,而另一些则使用属性(如 清单 1 所示)。实际上,通过比较元模型很容易就看出其中的区别。 |
Classifier 和 Feature 之间存在组合,后者是 StructuralFeature 的祖先。Attribute 派生自 StructuralFeature。
这个元模型令您感到迷惑吗?尝试忘掉它是一个元模型,一个关于 UML 的元模型,把它看作是一个普通的模型吧。图 2 简单地指出了 Class 的概念,这是一种和接口以及数据类型有关(通过从 Classifier 继承)的高度专业化的元素。Class 拥有名称、可见性以及其他许多性质。最后,Class 和 Attribute 之间存在关联。
因此,图 2 形式化地表示一个类可以有名称、可见性和其他特性,还可以具有属性。事实上,图 2 是 UML 类的定义。如果您觉得迷惑,可能是因为这个定义本身是用 UML 编写的!
为了简单起见,我在 图 1 中有意省略了名称空间、约束、原型、继承以及使类之所以成为类的其他因素。请相信我,这些都包括在完整的 UML 元模型中,但是对本文而言没有用处。
何必为元模型费心呢?因为在交给 XMI 算法时您得到的是 UML 的 XML 词汇表。作为一个例子,清单 1 是图 3 的一种 XMI 表示(应用规范中所示范的 XMI 变体,参见 前述):
图 3. 地址的 UML 模型清单 1. 导出到 XMI 的地址
<XMI xmi.version="1.2" xmlns:UML="org.omg/UML/1.4">
<XMI.header>
<XMI.documentation>
<XMI.exporter>ananas.org stylesheet</XMI.exporter>
</XMI.documentation>
<XMI.metamodel xmi.name="UML" xmi.version="1.4"/>
</XMI.header>
<XMI.content>
<UML:Model xmi.id="M.1" name="address" visibility="public"
isSpecification="false" isRoot="false"
isLeaf="false" isAbstract="false">
<UML:Namespace.ownedElement>
<UML:Class xmi.id="C.1" name="address" visibility="public"
isSpecification="false" namespace="M.1" isRoot="true"
isLeaf="true" isAbstract="false" isActive="false">
<UML:Classifier.feature>
<UML:Attribute xmi.id="A.1" name="name" visibility="private"
isSpecification="false" ownerScope="instance"/>
<UML:Attribute xmi.id="A.2" name="street" visibility="private"
isSpecification="false" ownerScope="instance"/>
<UML:Attribute xmi.id="A.3" name="zip" visibility="private"
isSpecification="false" ownerScope="instance"/>
<UML:Attribute xmi.id="A.4" name="region" visibility="private"
isSpecification="false" ownerScope="instance"/>
<UML:Attribute xmi.id="A.5" name="city" visibility="private"
isSpecification="false" ownerScope="instance"/>
<UML:Attribute xmi.id="A.6" name="country" visibility="private"
isSpecification="false" ownerScope="instance"/>
</UML:Classifier.feature>
</UML:Class>
</UML:Namespace.ownedElement>
</UML:Model>
</XMI.content>
</XMI>
要注意,清单 1 中的 XML 元素和属性是如何与 图 2 中的类和属性匹配的。您现在又回到了原地:XMI 文档是 UML 元模型的直接表示,因为 UML 元模型是 UML 本身的描述。
表示的问题
UML 元模型的一部分处理概念的可视化表示——把概念画到屏幕的何处。由于两方面的原因我的样式表中没有处理这些信息:
- 从 UML 模型派生出 XML 模式不需要这些信息。
- 从 XML 模式派生 UML 模型时生成可视化的输出非常困难。更合理的选择是用建模工具打开模型,花几分钟准备模型在屏幕上的可视化表示。最困难的工作(正确的定义)已经由样式表完成了。
XSLT 样式表
现在您已经掌握了阅读 XMI 文件的要点,很容易就能把 XMI 标签映射成等价的 XML 模式。一种可能的映射是:
UML:Model
变成xs:schema
;目标名称空间从模型名导出。UML:Class
变成全局 XML 元素声明(xs:element
)。UML:Attribute
变成本地 XML 元素声明(xs:element
)。
清单 2 是实现这种映射的 XSLT 样式表:
清单 2. XML 模式派生<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:UML="org.omg/UML/1.4"
exclude-result-prefixes="UML"
version="1.0">
<xsl:output indent="yes"/>
<xsl:template match="XMI[@xmi.version='1.2']">
<xsl:apply-templates select="XMI.content/UML:Model"/>
</xsl:template>
<xsl:template match="XMI">
<xsl:message terminate="yes">Unknown XMI version</xsl:message>
</xsl:template>
<xsl:template match="UML:Model">
<xs:schema targetNamespace="http://psol.com/uml/{@name}">
<xsl:apply-templates/>
</xs:schema>
</xsl:template>
<xsl:template match="UML:Namespace.ownedElement/UML:Class">
<xs:element name="{@name}">
<xs:complexType>
<xs:sequence>
<xsl:apply-templates/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xsl:template>
<xsl:template match="UML:Attribute">
<xs:element name="{@name}" type="xs:string"/>
</xsl:template>
<xsl:template match="text()">
<xsl:value-of select="normalize-space(.)"/>
</xsl:template>
</xsl:stylesheet>
显然,清单 2 中的样式表功能非常有限(只进行了很少的错误检查),因为它仅仅支持 UML 元模型很小的一个子集。它没有考虑包、接口、关联等等。只需要对上面描述的过程稍加扩展,就可以进一步完善这个样式表以支持上述概念:研究 UML 元模型中相应的部分、定义到 XML 模式的映射然后实现它。
反过来一样
如果遵循常规的建模流程,很容易得到 清单 2。您经常会发现已经存在一个 XML 模式,可以作为工作的起点。重新建立 UML 模型太麻烦了,如果由一个样式表实现逆映射会非常方便。清单 3 是一个例子:
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:UML="org.omg/UML/1.4"
exclude-result-prefixes="xs"
version="1.0">
<xsl:output indent="yes"/>
<xsl:template match="xs:schema">
<XMI xmi.version="1.2">
<XMI.header>
<XMI.documentation>
<XMI.exporter>dW simple stylesheet</XMI.exporter>
</XMI.documentation>
<XMI.metamodel xmi.name="UML" xmi.version="1.4"/>
</XMI.header>
<XMI.content>
<UML:Model xmi.id="{generate-id()}"
name="{substring-after(@targetNamespace,'http://psol.com/uml/')}"
visibility="public" isSpecification="false"
isRoot="false" isLeaf="false" isAbstract="false">
<UML:Namespace.ownedElement>
<xsl:apply-templates/>
</UML:Namespace.ownedElement>
</UML:Model>
</XMI.content>
</XMI>
</xsl:template>
<xsl:template match="xs:element">
<UML:Class xmi.id="{generate-id()}" name="{@name}"
visibility="public" isSpecification="false" isRoot="true"
isLeaf="true" isAbstract="false" isActive="false">
<xsl:apply-templates/>
</UML:Class>
</xsl:template>
<xsl:template match="xs:sequence">
<UML:Classifier.feature>
<xsl:apply-templates/>
</UML:Classifier.feature>
</xsl:template>
<xsl:template match="xs:sequence/xs:element">
<UML:Attribute xmi.id="{generate-id(.)}" name="{@name}"
visibility="private" isSpecification="false"
ownerScope="instance"/>
</xsl:template>
</xsl:stylesheet>
更复杂的样式表
如果要说本文中介绍的样式表很简单,就太过谨慎了。这些例子一般不到 50 行,只能处理 UML 元模型的一个子集。实际的样式表能够识别多得多的 UML 概念,通常需要 500 行甚至更多。本期文章的目标是介绍自动化模型派生背后的概念:
- 这些模型(UML、XML 模式)都用一个数据集表示,这种特殊的数据集称为元模型。
- 可以建立 UML 元模型和 XML 模式之间的映射。
- 可以通过 XSLT 样式表实现这种映射。
- UML 和 XML 模式仅仅是同一事实的不同表示,区别在于服务于不同的目标。
如果您尝试扩展 清单 2 和 清单 3 中的样式表,可能会遇到两个问题:
- UML 模型可能不够具体(因为是一种高级视图),无法派生出有意义的 XML 模式(低级的、详细的模型)。
- UML 元模型和 XML 模式之间可能存在多种合理的映射。