zoukankan      html  css  js  c++  java
  • HtmlAgilityPack

    HtmlAgilityPack是.net下的一个HTML解析类库。支持用XPath来解析HTML。这个意义不小,为什么呢?因为对于页面上的元素的xpath某些强大的浏览器能够直接获取得到,并不需要手动写。节约了大半写正则表达式的时间,当然正则表达式有时候在进一步获取的时候还需要写,但是通过xpath解析之后,正则表达式已经要匹配的范围已经非常小了。而且,不用正则表达式在整个页面源代码上匹配,速度也会有提升。总而言之,通过该类库,先通过浏览器获取到xpath获取到节点内容然后再通过正则表达式匹配到所需要的内容,无论是开发速度,还是运行效率都有提升。

      HtmlAttribute  对应  Html元素的属性

      HtmlAttributeCollection  一个元素属性的集合,实现了IList<HtmlAttribute>, ICollection<HtmlAttribute>, IEnumerable<HtmlAttribute>, IEnumerable,都是集合的那一套东西,没有新东西。

      HtmlNode    对应  HTML节点,包括注释,文本,元素等

      HtmlNodeCollection  一个HtmlNode节点集合,实现了HtmlNodeCollection : IList<HtmlNode>, ICollection<HtmlNode>, IEnumerable<HtmlNode>, IEnumerable继承了这些东西就没什么需要说的了,都是集合的东西,没有新的东西。完全是集合那一套。

      HtmlNodeType  一个枚举  表示节点的类型,文档,注释,元素,文本。

      HtmlTextNode  对应Html文本节点,很简单的一个类,继承自HtmlNode。

      HtmlEntity   对应实体   实用程序类以替换特殊字符的实体,反之亦然

      HtmlParseError   表示文档在解析过程中发现的解析错误。

      还有一些其他的类,留到以后有用过的时候再补充。

      

    下载地址:http://htmlagilitypack.codeplex.com/

  • 相关阅读:
    sicily 山海经 线段树实例
    常用位运算
    广度优先搜索有环图
    线性O(N)时间复杂度求素数 , 筛法
    sicily2014
    机器学习中相似性度量(转载)
    VS2010中Parallel的使用
    CKeditor与Asp.net验证控件的问题
    将div一直保持到页面底部
    利用DataAnnotations验证实体(类)的属性
  • 原文地址:https://www.cnblogs.com/hofmann/p/12168065.html
Copyright © 2011-2022 走看看