zoukankan      html  css  js  c++  java
  • Python爬虫:获取新浪网新闻

    代码

    #coding:utf-8
    
    import requests
    from bs4 import BeautifulSoup
    
    res = requests.get("http://news.sina.com.cn/china/")
    res.encoding = "utf-8"
    
    soup = BeautifulSoup(res.text,'html.parser')
    for news in soup.select('.blk122'):
        # print news
        new_as = news.select("a")
        i = 1
        for news_a in new_as:
            print '第%d条新闻标题:'%i,news_a.text
            i = i+1
    

    结果

    第1条新闻标题: 少将为何带500多名海军未来精英赴欧
    第2条新闻标题: 9月18日 这4艘中国军舰齐聚日本海
    第3条新闻标题: 中国最大市同时调整2名高层 其中1人为跨界入政
    第4条新闻标题: “百名红通人员”王林娟回国投案 已到案45人
    第5条新闻标题: 海军戚继光舰首次远航实习出访 舰上能唱K健身
    第6条新闻标题: 35颗卫星3重天网 中国这个全球定位系统厉害了
    第7条新闻标题: 港中大“标语战”升级 有人贴出:这里就是中国
    第8条新闻标题: 韩媒:萨德问题致韩企对中国直接投资缩水近一半
    第9条新闻标题: 刚与台“断交”三个月 巴拿马总统对中国送祝愿
    第10条新闻标题: 天舟一号与天宫二号分离 最终将陨落太平洋
    第11条新闻标题: 新华社:从金砖国家领导人会晤看五大民生实惠
    
  • 相关阅读:
    关于c语言的左移运算
    如何修改mac的root密码
    LaTeX语法笔记
    texlive测试是否安装成功
    latex学习(四)tlmgr
    latex学习(三)
    latex学习(二)
    Latex学习(一)
    引导修复软件boot-repair
    MySQL远程连接和备份还原
  • 原文地址:https://www.cnblogs.com/Mysterious/p/7538833.html
Copyright © 2011-2022 走看看