zoukankan      html  css  js  c++  java
  • 一段Python爬虫代码的分析

    import re
    import requests
    from bs4 import BeautifulSoup
    from openpyxl import Workbook
    from openpyxl.styles import Alignment

    requests:网页爬取的第三方库 

    re:内容解析模块,用于 正则表达式,处理字符串的模块。            

    BeautifulSoup=bs4:内容解析,用于提取HTML和XML里的数据。  

    通常,Beautiful Soup库的使用:

    from bs4 import BeautifulSoup     #主要使用BeautifulSoup类
    

     一个是库,一个是库里边的类。 

     openpyxl是读写 Excel 文件的 Python 库

    workbook:

    在刚开始使用openpyxl的时候,不需要直接在文件系统中创建一个文件,仅仅需要导入Workbook类并开始使用它:

    from openpyxl import Workbook
    wb = Workbook()
    

    openpyxl模块中与字体,颜色,背景,边框,字体,行宽,行高,单元格格式等相关的内容都放在了styles模块中;

    styles能够提供的样式有以下几块:

    Font:来设置文字的大小,颜色和下划线等

    PatternFill:填充图案和渐变色

    Border:单元格的边框

    Alignment:单元格的对齐方式等

    protection:写保护

  • 相关阅读:
    LeetCode刷题7——数字的补数
    Leetcode刷题6—不同路径
    Leetcode刷题5—最大子序和
    LeetCode刷题4——子集
    LeetCode刷题3——位1的个数
    LeetCode刷题2——颠倒二进制位
    小鸡啄米问题求解
    weavenet
    为系统守护进程预留计算资源
    PolicyRouting (ip rule)
  • 原文地址:https://www.cnblogs.com/2016-11-13/p/13203113.html
Copyright © 2011-2022 走看看