zoukankan      html  css  js  c++  java
  • HtmlAgilityPack遍历节点后SelectSingleNode始终只找到第一个节点

    问题描述:使用HtmlAgilityPack分析页面结构,抓取到要遍历的节点列表后,foreach每个节点,数据取到的都一样,代码如下

       HtmlNodeCollection carInfList = htmlDoc.DocumentNode.SelectNodes("//div[@id='brandtab-1']/div[@class='list-cont']/div");
       foreach (var item in carInfList)
       {
         var carInfName = item.SelectSingleNode("//div[@class='list-cont-main']/div/a[@class='font-bold']").InnerText.Replace("
    ", "").Replace("
    ", "").Replace("	", "");
       }

    carInfName每次取到的值都是一样的,百思不得其解,直到查询到了这篇文章:https://www.cnblogs.com/yangjinwang/p/6424552.html,修改后的代码如下

       HtmlNodeCollection carInfList = htmlDoc.DocumentNode.SelectNodes("//div[@id='brandtab-1']/div[@class='list-cont']/div");
       foreach (var item in carInfList)
       {
           var xpath = item.XPath;
           var carInfName = item.SelectSingleNode(xpath + "//div[@class='list-cont-main']/div/a[@class='font-bold']").InnerText.Replace("
    ", "").Replace("
    ", "").Replace("	", "");
       }

    之前理解的SelectSingleNode应该是在给定的item的范围之内,结果不是,是在全局范围搜,所以需要给定item的当前路径,这样才能找到想要的数据。

    =========================================================================================================================

    对了,再补充一点:

    carInfModel.CarLevel = item.SelectSingleNode(xpath + "//div[@class='list-cont-main']/div[2]/div[1]/ul[1]/li[1]/span").InnerText;

    里面的div[X]竟然不是从0开始的,是从1开始的,太反程序员逻辑了。。。

  • 相关阅读:
    Python六大开源框架对比:Web2py略胜一筹
    软件设计之UML—UML的构成[上]
    Web程序员最常用的11款PHP框架
    PHP常见框架
    WinCE的开发流程
    Windows10如何卸载OneDrive
    Windows系统中环境变量不展开的问题
    线程局部存储空间
    ping pathping tcping psping tracert
    ubuntu ufw 配置
  • 原文地址:https://www.cnblogs.com/wangbg/p/9297929.html
Copyright © 2011-2022 走看看