zoukankan      html  css  js  c++  java
  • python相关知识

    今天学习了python爬虫相关的知识,有了一定的了解

    网络格式:1.json格式
    2.bs4.BeautifulSoup() 提取数据 自动纠正html出错(有限)
    函数的参数
    解析器:1 lxml解析器 基于C语言开发的 解析速度快,但是需要额外安装,适用于大量的数据进行解析
                 2 html.parser BeautifulSoup内置的解析器,不需要安装
                    遍历文档树 搜索文档树(通过制定的标签名,属性名(唯一的)来寻找节点)
    3.html子节点 兄弟节点
    4.正则表达式:
    findall函数:用于查找字符串中所有符合正则表达式的字符串,返回一个列表
    例:
    import re
    python='python2 python3 are all python'
    print(re.findall('python',python))
    输出:['python', 'python', 'python']
    5.http:超文本传输线协议
      https:安全超文本传输协议 数据加密
  • 相关阅读:
    学生排序,使用三层优先级
    利用类计算学生成绩和排序
    join()函数
    对象
    015_eclipse开发环境的使用
    013_运算符_算术
    012_变量
    011_jdk7新特性
    010_类型提升问题
    008_浮点数误差问题
  • 原文地址:https://www.cnblogs.com/zhang12345/p/12270216.html
Copyright © 2011-2022 走看看