zoukankan      html  css  js  c++  java
  • HtmlAgilityPack

    HtmlAgilityPack是.net下的一个HTML解析类库。支持用XPath来解析HTML。这个意义不小,为什么呢?因为对于页面上的元素的xpath某些强大的浏览器能够直接获取得到,并不需要手动写。节约了大半写正则表达式的时间,当然正则表达式有时候在进一步获取的时候还需要写,但是通过xpath解析之后,正则表达式已经要匹配的范围已经非常小了。而且,不用正则表达式在整个页面源代码上匹配,速度也会有提升。总而言之,通过该类库,先通过浏览器获取到xpath获取到节点内容然后再通过正则表达式匹配到所需要的内容,无论是开发速度,还是运行效率都有提升。

      HtmlAttribute  对应  Html元素的属性

      HtmlAttributeCollection  一个元素属性的集合,实现了IList<HtmlAttribute>, ICollection<HtmlAttribute>, IEnumerable<HtmlAttribute>, IEnumerable,都是集合的那一套东西,没有新东西。

      HtmlNode    对应  HTML节点,包括注释,文本,元素等

      HtmlNodeCollection  一个HtmlNode节点集合,实现了HtmlNodeCollection : IList<HtmlNode>, ICollection<HtmlNode>, IEnumerable<HtmlNode>, IEnumerable继承了这些东西就没什么需要说的了,都是集合的东西,没有新的东西。完全是集合那一套。

      HtmlNodeType  一个枚举  表示节点的类型,文档,注释,元素,文本。

      HtmlTextNode  对应Html文本节点,很简单的一个类,继承自HtmlNode。

      HtmlEntity   对应实体   实用程序类以替换特殊字符的实体,反之亦然

      HtmlParseError   表示文档在解析过程中发现的解析错误。

      还有一些其他的类,留到以后有用过的时候再补充。

      

    下载地址:http://htmlagilitypack.codeplex.com/

  • 相关阅读:
    物理机和虚拟机互相可以ping通,还是无法连接
    CentOS 7: ping Name or service not known
    Ubuntu上安装搜狗输入法(sogou)
    成功安装 tesserocr
    The following untracked working tree files would be overwritten by merge
    切换本地凭据(Windows上登录的GitHub账号)
    配置了SSH后还是每次都要求输入密码
    dpkg dependency problems prevent configuration
    mui 设置应用全屏模式
    解决烦人的缓存问题!
  • 原文地址:https://www.cnblogs.com/hofmann/p/12168065.html
Copyright © 2011-2022 走看看