zoukankan      html  css  js  c++  java
  • HtmlAgilityPack遍历节点后SelectSingleNode始终只找到第一个节点

    问题描述:使用HtmlAgilityPack分析页面结构,抓取到要遍历的节点列表后,foreach每个节点,数据取到的都一样,代码如下

       HtmlNodeCollection carInfList = htmlDoc.DocumentNode.SelectNodes("//div[@id='brandtab-1']/div[@class='list-cont']/div");
       foreach (var item in carInfList)
       {
         var carInfName = item.SelectSingleNode("//div[@class='list-cont-main']/div/a[@class='font-bold']").InnerText.Replace("
    ", "").Replace("
    ", "").Replace("	", "");
       }

    carInfName每次取到的值都是一样的,百思不得其解,直到查询到了这篇文章:https://www.cnblogs.com/yangjinwang/p/6424552.html,修改后的代码如下

       HtmlNodeCollection carInfList = htmlDoc.DocumentNode.SelectNodes("//div[@id='brandtab-1']/div[@class='list-cont']/div");
       foreach (var item in carInfList)
       {
           var xpath = item.XPath;
           var carInfName = item.SelectSingleNode(xpath + "//div[@class='list-cont-main']/div/a[@class='font-bold']").InnerText.Replace("
    ", "").Replace("
    ", "").Replace("	", "");
       }

    之前理解的SelectSingleNode应该是在给定的item的范围之内,结果不是,是在全局范围搜,所以需要给定item的当前路径,这样才能找到想要的数据。

    =========================================================================================================================

    对了,再补充一点:

    carInfModel.CarLevel = item.SelectSingleNode(xpath + "//div[@class='list-cont-main']/div[2]/div[1]/ul[1]/li[1]/span").InnerText;

    里面的div[X]竟然不是从0开始的,是从1开始的,太反程序员逻辑了。。。

  • 相关阅读:
    使用汇编语言编写注入代码
    代码注入
    DLL卸载
    DLL注入
    nginx图片防盗链
    apache字体文件跨域、路由去掉index.php
    windows下访问虚拟机中配置的虚拟主机
    deepin docker 安装
    Deepin 配置ssh
    下拉框多选
  • 原文地址:https://www.cnblogs.com/wangbg/p/9297929.html
Copyright © 2011-2022 走看看