zoukankan      html  css  js  c++  java
  • XPath操作XML文档

      NET框架下的Sytem.Xml.XPath命名空间提供了一系列的类,允许应用XPath数据模式查询和展示XML文档数据。

    3.1XPath介绍

     主要的目的是在xml1.0和1.1文档节点树种定位节点。XPath是一种表达式语言,他的返回值可能是节点、节点集合、原子值(文本),以及节点和原子值的混合等。

      1、XPath节点

      在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。树的根被称为文档节点或者根节点

    <?xml version="1.0" encoding="ISO-8859-1"?>
    
    <bookstore>
    
    <book>
      <title lang="en">Harry Potter</title>
      <author>J K. Rowling</author> 
      <year>2005</year>
      <price>29.99</price>
    </book>
    
    </bookstore>
    <bookstore> (文档节点)
    <author>J K. Rowling</author> (元素节点)
    lang="en" (属性节点)

    基本值(或称原子值,Atomic value),基本值是无父或无子的节点。

    J K. Rowling
    "en"

    项目是文本或者节点。

    节点之间的关系:

    父(Parent)每个元素以及属性都有一个父。子(Children)元素节点可有零个、一个或多个子。同胞(Sibling)拥有相同的父的节点。先辈(Ancestor)某节点的父、父的父,等等。后代(Descendant)某个节点的子,子的子,等等。

      2、XPath语法

      XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

    选取节点

    XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

    下面列出了最有用的路径表达式:

    表达式描述
    nodename 选取此节点的所有子节点。
    / 从根节点选取。
    // 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
    . 选取当前节点。
    .. 选取当前节点的父节点。
    @ 选取属性。

      

    在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

    路径表达式结果
    bookstore 选取 bookstore 元素的所有子节点。
    /bookstore

    选取根元素 bookstore。

    注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!

    bookstore/book 选取属于 bookstore 的子元素的所有 book 元素。
    //book 选取所有 book 子元素,而不管它们在文档中的位置。
    bookstore//book 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置。
    //@lang 选取名为 lang 的所有属性。

     

     

     

     

     

     

     

     

     

    谓语(Predicates)

    谓语用来查找某个特定的节点或者包含某个指定的值的节点。

    谓语被嵌在方括号中。

    实例

    在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

    路径表达式结果
    /bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。
    /bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。
    /bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。
    /bookstore/book[position()<3] 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
    //title[@lang] 选取所有拥有名为 lang 的属性的 title 元素。
    //title[@lang='eng'] 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。
    /bookstore/book[price>35.00] 选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。
    /bookstore/book[price>35.00]/title 选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。

     

     

     

     

     

    选取未知节点

    XPath 通配符可用来选取未知的 XML 元素。

    通配符描述
    * 匹配任何元素节点。
    @* 匹配任何属性节点。
    node() 匹配任何类型的节点。

     

     

     

    实例

    在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

    路径表达式结果
    /bookstore/* 选取 bookstore 元素的所有子元素。
    //* 选取文档中的所有元素。
    //title[@*] 选取所有带有属性的 title 元素。

     

     

    4、XPath 轴

    轴可定义相对于当前节点的节点集。

    轴名称结果
    ancestor 选取当前节点的所有先辈(父、祖父等)。
    ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
    attribute 选取当前节点的所有属性。
    child 选取当前节点的所有子元素。
    descendant 选取当前节点的所有后代元素(子、孙等)。
    descendant-or-self 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
    following 选取文档中当前节点的结束标签之后的所有节点。
    namespace 选取当前节点的所有命名空间节点。
    parent 选取当前节点的父节点。
    preceding 选取文档中当前节点的开始标签之前的所有节点。
    preceding-sibling 选取当前节点之前的所有同级节点。
    self 选取当前节点。

     

     

     

     

     

     

     

    位置路径表达式

    位置路径可以是绝对的,也可以是相对的。

    绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:

    绝对位置路径:

    /step/step/...

    相对位置路径:

    step/step/...

    每个步均根据当前节点集之中的节点来进行计算。

    步(step)包括:

    轴(axis)
    定义所选节点与当前节点之间的树关系
    节点测试(node-test)
    识别某个轴内部的节点
    零个或者更多谓语(predicate)
    更深入地提炼所选的节点集

    步的语法:

    轴名称::节点测试[谓语]

    实例

    例子结果
    child::book 选取所有属于当前节点的子元素的 book 节点。
    attribute::lang 选取当前节点的 lang 属性。
    child::* 选取当前节点的所有子元素。
    attribute::* 选取当前节点的所有属性。
    child::text() 选取当前节点的所有文本子节点。
    child::node() 选取当前节点的所有子节点。
    descendant::book 选取当前节点的所有 book 后代。
    ancestor::book 选择当前节点的所有 book 先辈。
    ancestor-or-self::book 选取当前节点的所有 book 先辈以及当前节点(如果此节点是 book 节点)
    child::*/child::price 选取当前节点的所有 price 孙节点。

     

    XPath 表达式可返回节点集、字符串、逻辑值以及数字。

    XPath 运算符

    5、XPath函数

        XPath与XSLT、XQuery等共享函数库。函数库提供了功能丰富的各种内置函数。(XML函数)

    3.2XPath数据模型

       NET框架的XPath数据模型依赖于System.Xml.XPath命名空间中的XPathNavigator类,。XPathNavigator类是一个抽象类,提供基于光标的导航模型遍历XML文档的数据,它还允许你编辑XML文档。

    能从任何一个实现IXPathNavigator接口的类获得XPathNavigatorD的实例。XmlDocument和XPathDocument均已实现这个接口。

      System.Xml.XPath命名空间中的XPathDocument类使用XPath数据模型。提供了一个只读的代表一个xml文档的实例。

       由于XmlDocument返回的XPathNavigator实例是可以编辑的,XPathDocument返回的实例是只读的。由于俩者都实现了IXPathNavigator接口,因而俩者都提供CreateNavigator方法用于创建XPahNavigator类的对象。

    XPathDocument _doc = new XPathDocument(Application.StartupPath + @"Customers.xml");
    XPathNavigator _na = _doc.CreateNavigator();

      1.应用XPathNavigator遍历xml文档

     //Move to root of document (<?xml version="1.0" encoding="utf-8" ?>)光标移动到文档的根处
      _na.MoveToRoot();
      _na.MoveToFirstChild();//Move the cursor to <customers> node光标移动到文档的customer节点处
    na.MoveToNext();
    _na.MoveToParent();

     2、选择XML文档节点

       选择文档中符合某些条件的某个或者某些节点。

       XPathNodeIterator _iterator = _na.Select(txtexpression.Text);
       //XPathNodeIterator _iterator = _na.Select(_exp);
       lblmessage.Text = "The expressions returned " + _iterator.Count + " nodes";
       if (_iterator.Count > 0)
       {
         while (_iterator.MoveNext())
         {
             txtresult.Text += _iterator.Current.OuterXml;//Show the XML format of node(s)
         }
       }

     Select方法接受XPah的表达式作为输入参数,返回XpahNodeIterator类的实例。

     XpahNodeIterator类提供一些列的属性和方法允许你遍历返回的节点。在每个节点上,使用Current属性能给当前节点一个XPahtNavigator的引用。

     然后可以调用调用XpahNodeIterator的任何方法和属性。SelectSingleNode 也支持XPath表达式返回一个XpahNodeIterator类型的对象。

    该对象包括了符合XPah表达式条件的所有节点中的第一个节点。然后可以应用XpahNodeIterator访问该节点的属性和子节点。

     除了上面的俩个方法外,还有三个方法

        SelectChildren()方法=>节点名为参数,返回一个XpahNodeIterator类型对象,该对象包括当前节点的所有符合节点名的子节点。

        SelectAncetors()方法=>节点名为参数,返回一个保包括当前节点的所有符合节点名的先辈节点的XpahNodeIterator类型的对象。

        SelectDescendants()方法,节点名为参数,返回一个包括当前节点的所有符合节点名的后辈节点的XpahNodeIterator类型的对象。

    在前面的例子中我们通过XPahNavigator类的GetAttribute()方法来访问元素属性 的值,但在文档如果元素具有多个属性,并且需要都访问时,XPahNavigator类

    提供了三个函数方法来实现这个功能。MoveToAttribute()、MoveToFirstAttribute()和MoveToNextAttribute()..........

     3、通过XPahtNavigator获得XmlReader和XmlWriter

       XmlReader可以进一步读取返回的节点。通过调用XPathNavigator的ReadSubTree()方法获得XmlReader。

       XmlWriter=》WriterSubTree()方法创建,该方法接受一个XmlWriter作为输入的参数,并将当前节点写入XmlWriter中。

    XmlTextWriter _writer = new XmlTextWriter(txtfilepath.Text, null);
    try
    {
      _na.WriteSubtree(_writer);
    }
    catch (Exception ex)
    {
       MessageBox.Show(ex.Message);
    }
    finally
    {
        writer.Close();
        iswrite = true;
    }
    if (_id == txtID.Text)
     {
          XmlReader _reader = _na.ReadSubtree();
          ShowDetail(_reader);
      }

    4、用XPahNavigator类编辑xml文档

       实际上通常情况下,从XPahDocument获得XPahNavigator实例对象是只读的,因而不能用于编辑。而从XmlDocument获得对象可以用于编辑。通常用XPahNavigator的CanEdit的属性来检查XPathNavigator的实例是否可以用于编辑。是则返回true,否则为false。

     
     
     
  • 相关阅读:
    WPF 使用 Direct2D1 画图 绘制基本图形
    WPF 使用 Direct2D1 画图 绘制基本图形
    dot net core 使用 IPC 进程通信
    dot net core 使用 IPC 进程通信
    win2d 图片水印
    win2d 图片水印
    Java实现 LeetCode 240 搜索二维矩阵 II(二)
    PHP closedir() 函数
    PHP chroot() 函数
    PHP chdir() 函数
  • 原文地址:https://www.cnblogs.com/zhlziliaoku/p/5229760.html
Copyright © 2011-2022 走看看