zoukankan      html  css  js  c++  java
  • 数据提取方法


    数据提取就是从响应中提取我们想要的数据的过程
    一、json
    1.是一种轻量级的数据交换格式,它使的人们容易进行阅读和编写。同时也方便了机器进行解析和生成,适用于数据交互的场景,比如网站与后台之间的数据交互
    2.在数据交换中起到了一个载体的作用,承载着相互传递的数据
    二、XPATH和LXML类库
    1.lxml是一款高性能的python HTML/xml解析器,我们可以利用xpath,来快速的定位特定元素以及获取节电信息
    2.Xpath(xml path language)是一门在html/xml文档中查找信息的语言,可用来在html/xml文档中对元素和属性进行遍历。
    3.xml 可扩展标记语言 被设计为传输和存储数据,其焦点是数据的内容
    html 超文本标记语言 显示数据以及如何更好显示数据
    4.节点选择语法
    nodename 选取此节点的所有节点
    / 从根节点选取
    // 从匹配选择的当前节点选择文档中的节点,而不考虑他们的位置
    . 选取当前节点
    .. 选取当前节点的父节点
    @ 选取属性

  • 相关阅读:
    随机小错2_0527
    随计小错
    C++实现读写文件
    03-树2 List Leaves (25 分)
    获取毫秒级的时间戳
    new对象时,类名后加括号与不加括号的区别
    FoxMail 7.2的邮件存储目录修改
    C/C++ 开源算法库
    VS2015的安装
    脏内存导致BUG的问题
  • 原文地址:https://www.cnblogs.com/qinyr0725/p/10530528.html
Copyright © 2011-2022 走看看