zoukankan      html  css  js  c++  java
  • 爬取校园新闻首页的新闻

    1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。

    2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。

    3. 将其中的发布时间由str转换成datetime类型。

    4. 将完整的代码及运行结果截图发布在作业上。

    import requests
    from bs4 import BeautifulSoup
    from datetime import datetime
    
    url = 'http://news.gzcc.cn/html/xiaoyuanxinwen/'
    res = requests.get(url)
    res.encoding = 'utf-8'
    soup = BeautifulSoup(res.text, 'html.parser')
    for news in soup.select('li'):
        if len(news.select('.news-list-title'))>0:
            d = news.select('.news-list-info')[0].contents[0].text
            t = news.select('.news-list-title')[0].text
            a = news.select('a')[0].attrs['href']
            resd = requests.get(a)
            resd.encoding = 'utf-8'
            soupd = BeautifulSoup(resd.text, 'html.parser')
    
            c = soupd.select('.show-info')[0].text
            tm = c.lstrip('发布时间:')[:19]
            zz = c[c.find('作者:'):].split()[0].lstrip('作者:')
            sh = c[c.find('审核:'):].split()[0].lstrip('审核:')
            ly = c[c.find('来源:'):].split()[0].lstrip('来源:')
            dj = c[c.find('点击:'):].split()[0].lstrip('点击:')
    
            print(d, t, a)
            print(soupd.select('#content')[0].text)
            print( tm, zz, sh, ly, dj)
            break
    
    now = datetime.now()
    print(now)
    tm = str('2018-04-01 11:57:00')
    dt = datetime.strptime(tm, '%Y-%m-%d %H:%M:%S')
    print(dt)
    

    运行结果:

    2018-04-01 党情国情在我心,理想信仰伴我行——我校举行十九届三中全会和2018年“两会”知识竞赛 http://news.gzcc.cn/html/2018/xiaoyuanxinwen_0401/9167.html
    
                
                  为了认真贯彻党的十九届三中全会精神和2018年“两会”精神,引导大学生关注国家时政热点,全面把握党情和国情,强化大学生的“四个意识”,深入理解新时代中国特色社会主义思想,进一步坚定大学生马克思主义信仰,我校马克思主义学院面向全校举办了十九届三中全会和2018年“两会”知识竞赛。3月21日,经过严格的初赛笔试选拔,8支代表队脱颖而出,进入决赛。3月29日中午,知识竞赛决赛在第一报告厅主会场和第二报告厅分会场举行。马克思主义学院院长权麟春,副院长王相东、余九林出席了本次比赛。全体思政教师、信仰教育研习班700多名学员观看了本次比赛。比赛由许前进、王璇主持。
    
      在庄严的国歌声中,决赛正式拉开序幕。本次决赛分为必答和抢答两个环节,所有选手全身心投入比赛。必答环节,选手们准备充分,胸有成竹,各代表队分数不相上下。抢答环节,选手们全神贯注,争分夺秒,斗志满满,现场气氛既紧张又活跃,观众不时为选手的出色表现欢呼鼓掌。经过激烈的角逐,根据两个环节的最后得分,第一队的林铄姿、徐映珠、陈诗媛与第八队的程媚、雷小云、陈海燕获得一等奖;第二队的吴绮婷、曾楷芬、梁晓棋,第三队的林靖、黄琪琳、许悦,第六队的林锦涛、马丽群、赵志红,第五队的杨少璟、黄金龙、郑文婷获得二等奖;第七队的黄楚婷、李国祥、符琼文,第四队的陈玉萍、黄芷萱、张小梅获得三等奖。王相东、余九林、陈流芳为获奖团队颁奖。
    
      权麟春为本次比赛作总结。他指出,本次知识竞赛的选手都是经过老师层层严格筛选的优秀学生,他们的出色表现离不开指导老师的精心辅导。知识竞赛是手段和载体,本次知识竞赛,旨在认真学习贯彻十九届三中全会和“两会”精神,并落实在大学生的具体行动上。党的意志通过人民代表大会法定程序上升为国家意志,并体现人民意志,是党性与人民性的有机统一。不论是理论层面还是实践层面,都有力地证明了我国今天所取得的巨大成就离不开党的领导。当代大学生应该要热爱党,拥护党,永远跟党走,坚定马克思主义信仰,这才是创办信仰教育研习班的真正目的。
    
      此次知识竞赛不仅增加了大学生的理论知识,增强了参赛选手的团队协作能力,展现了当代大学生的风采,丰富了校园文化,更重要的是通过这种生动活泼的方式引导大学生对国家时政热点进行深入了解,以及对我国新时代新形势做准确研判,营造爱党爱国的氛围,帮助大学生坚定马克思主义信仰。
    
    
    第一报告厅决赛现场
    
    
    第二报告厅分会场现场
    
    
    颁奖
    
    2018-04-01 11:57:00 陈流芳 权麟春 马克思主义学院 次
    2018-04-03 17:47:27.545221
    2018-04-01 11:57:00
    

      

  • 相关阅读:
    @ModelAttribute注解详细使用
    Spring MVC使用注解实现账户注册与登陆
    @PathVariable、@RequestHeader与@CookieValue注解的使用案例
    IDEA搭建我的第一个Spring MVC应用(附使用注解实现)
    JDBC自定义工具类
    JDBC与MySQL实现分页查询技术
    JavaWeb实战——记录网站上一次访问时间
    微信小程序使用setData修改数组中的指定下标的属性值
    Centos6.x 无法 ping 外网 --- 已解决
    Ckeditor失去焦点前保留光标位置
  • 原文地址:https://www.cnblogs.com/-hjd/p/8710050.html
Copyright © 2011-2022 走看看