zoukankan      html  css  js  c++  java
  • 爬取微博热搜

    import requests
    from lxml import etree
    
    ###网址
    url="https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6"
    ###模拟浏览器
    header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36'}
    
    ###主函数
    def main():
        ###获取html页面
        html=etree.HTML(requests.get(url,headers=header).text)
        rank=html.xpath('//td[@class="td-01 ranktop"]/text()')
        affair=html.xpath('//td[@class="td-02"]/a/text()')
        view = html.xpath('//td[@class="td-02"]/span/text()')
        top=affair[0]
        affair=affair[1:]
        print('{0:<10}	{1:<40}'.format("置顶",top))
        for i in range(0, len(affair)):
            print("{0:<10}	{1:{3}<30}	{2:{3}>20}".format(rank[i],affair[i],view[i],chr(12288)))
    main()
    

     结果

  • 相关阅读:
    重新格式化部门表
    从不订购的客户
    回文数
    shell中的双括号表达式
    shell中的if语句
    shell
    view的生命周期
    shell中的数学运算
    shell中的expr命令
    shell中的退出状态码
  • 原文地址:https://www.cnblogs.com/1061321925wu/p/12268379.html
Copyright © 2011-2022 走看看