zoukankan      html  css  js  c++  java
  • python 抓取数据 存入 excel

    import requests
    import datetime
    from random import choice
    from time import time
    from openpyxl import load_workbook
    from openpyxl.utils import get_column_letter
    from bs4 import BeautifulSoup
    import re
    url='http://www.bazhou.gov.cn/xwzx/bzdt'
    strhtml=requests.get(url)
    soup=BeautifulSoup(strhtml.text,'lxml')
    data=soup.select('#content > div > div > div.mBd > ul > li > div.title > a')
    print(data)


    # 设置文件 ,需要先新建这个文件
    addr = "222.xlsx"
    # 打开文件
    wb = load_workbook(addr)
    # 创建一张新表
    ws = wb.create_sheet()
    # 第一行输入
    ws.append(['TITLE', 'URL','ID'])
    for item in data:

    TITLE = item.get_text()
    URL = item.get('href')
    ID = str(re.findall('d+',URL))
    ws.append([TITLE, URL, ID])

    # 获取最大行
    row_max = ws.max_row
    # 获取最大列
    con_max = ws.max_column
    # 把上面写入内容打印在控制台
    for j in ws.rows: # we.rows 获取每一行数据
    for n in j:
    print(n.value, end=" ") # n.value 获取单元格的值
    print()
    # 保存,save(必须要写文件名(绝对地址)默认 py 同级目录下,只支持 xlsx 格式)
    wb.save(addr)
  • 相关阅读:
    快速排序
    开博寄语
    002易语言编写获取人物坐标
    001寻找人物的坐标
    借条范例:
    python3练习-装饰器
    python3练习-杨辉三角/帕斯卡三角形
    python3内置函数
    Tableau修改参考线上显示的标签
    Tableau10.0学习随记-分组问题
  • 原文地址:https://www.cnblogs.com/apolloren/p/11171311.html
Copyright © 2011-2022 走看看