zoukankan      html  css  js  c++  java
  • HtmlAgilityPack

     HtmlAgilityPack是.net下的一个HTML解析类库。支持用XPath来解析HTML。这个意义不小,为什么呢?因为对于页面上的元素的xpath某些强大的浏览器能够直接获取得到,并不需要手动写。节约了大半写正则表达式的时间,当然正则表达式有时候在进一步获取的时候还需要写,但是通过xpath解析之后,正则表达式已经要匹配的范围已经非常小了。而且,不用正则表达式在整个页面源代码上匹配,速度也会有提升。总而言之,通过该类库,先通过浏览器获取到xpath获取到节点内容然后再通过正则表达式匹配到所需要的内容,无论是开发速度,还是运行效率都有提升。

      HtmlAttribute  对应  Html元素的属性

      HtmlAttributeCollection  一个元素属性的集合,实现了IList<HtmlAttribute>, ICollection<HtmlAttribute>, IEnumerable<HtmlAttribute>, IEnumerable,都是集合的那一套东西,没有新东西。

      HtmlNode    对应  HTML节点,包括注释,文本,元素等

      HtmlNodeCollection  一个HtmlNode节点集合,实现了HtmlNodeCollection : IList<HtmlNode>, ICollection<HtmlNode>, IEnumerable<HtmlNode>, IEnumerable继承了这些东西就没什么需要说的了,都是集合的东西,没有新的东西。完全是集合那一套。

      HtmlNodeType  一个枚举  表示节点的类型,文档,注释,元素,文本。

      HtmlTextNode  对应Html文本节点,很简单的一个类,继承自HtmlNode。

      HtmlEntity   对应实体   实用程序类以替换特殊字符的实体,反之亦然

      HtmlParseError   表示文档在解析过程中发现的解析错误。

      还有一些其他的类,留到以后有用过的时候再补充。

  • 相关阅读:
    _1_html_框架
    _0_web_基础
    _0_工具
    虚拟机安装与使用
    NumPy数据类型
    NumPy Ndarray对象
    机器学习之K-近邻(KNN)算法
    vue项目如何打包扔向服务器
    Eslint 规则说明
    Python ssh 远程执行shell命令
  • 原文地址:https://www.cnblogs.com/mingxuantongxue/p/3837750.html
Copyright © 2011-2022 走看看