zoukankan      html  css  js  c++  java
  • HtmlAgilityPack遍历节点后SelectSingleNode始终只找到第一个节点

    问题描述:使用HtmlAgilityPack分析页面结构,抓取到要遍历的节点列表后,foreach每个节点,数据取到的都一样,代码如下

       HtmlNodeCollection carInfList = htmlDoc.DocumentNode.SelectNodes("//div[@id='brandtab-1']/div[@class='list-cont']/div");
       foreach (var item in carInfList)
       {
         var carInfName = item.SelectSingleNode("//div[@class='list-cont-main']/div/a[@class='font-bold']").InnerText.Replace("
    ", "").Replace("
    ", "").Replace("	", "");
       }

    carInfName每次取到的值都是一样的,百思不得其解,直到查询到了这篇文章:https://www.cnblogs.com/yangjinwang/p/6424552.html,修改后的代码如下

       HtmlNodeCollection carInfList = htmlDoc.DocumentNode.SelectNodes("//div[@id='brandtab-1']/div[@class='list-cont']/div");
       foreach (var item in carInfList)
       {
           var xpath = item.XPath;
           var carInfName = item.SelectSingleNode(xpath + "//div[@class='list-cont-main']/div/a[@class='font-bold']").InnerText.Replace("
    ", "").Replace("
    ", "").Replace("	", "");
       }

    之前理解的SelectSingleNode应该是在给定的item的范围之内,结果不是,是在全局范围搜,所以需要给定item的当前路径,这样才能找到想要的数据。

    =========================================================================================================================

    对了,再补充一点:

    carInfModel.CarLevel = item.SelectSingleNode(xpath + "//div[@class='list-cont-main']/div[2]/div[1]/ul[1]/li[1]/span").InnerText;

    里面的div[X]竟然不是从0开始的,是从1开始的,太反程序员逻辑了。。。

  • 相关阅读:
    Android安全研究经验谈
    论文相关笔记5
    论文相关笔记4
    论文相关笔记3
    论文相关笔记2
    论文相关笔记1
    朝鲜RedStar_OS_3.0安装图解
    Careerup上的简历模板
    冒泡、二分排序
    火狐插件
  • 原文地址:https://www.cnblogs.com/wangbg/p/9297929.html
Copyright © 2011-2022 走看看