用requests库和BeautifulSoup4库爬取新闻列表

用requests库和BeautifulSoup4库，爬取校园新闻列表的时间、标题、链接、来源。
选一个自己感兴趣的主题，做类似的操作，为“爬取网络数据并进行文本分析”做准备。

#coding=gbk
import requests
from bs4 import BeautifulSoup


url='http://news.gzcc.cn/html/xiaoyuanxinwen/'
res=requests.get(url)
res.encoding='utf-8'
soup=BeautifulSoup(res.text,'html.parser')

for news in soup.select('li'):
    
    if len(news.select('.news-list-title'))>0:
        title=news.select('.news-list-title')[0].text #找到标题
        
        
        time=news.select('.news-list-info')[0].contents[0].text#标出时间
        url1=news.select('a')[0]['href']#url
        
        
        bumen=news.select('.news-list-info')[0].contents[1].text#什么部门
        description=news.select('.news-list-description')[0].text #对其进行描述描述
        
        
        print(time,title,bumen,url)

查看全文

相关阅读:
常用CSS代码大全（工作必备）
微信开发新增拖动组件--movableview介绍
 CSS---解决文本溢出，换行
 SublimeText 自带格式化代码功能
 后台界面也可以很酷！31个高大上的后台管理系统模版
 漏洞：阿里云盾phpMyAdmin <=4.8.1 后台checkPageValidity函数缺陷可导致GETSHELL
Linux系统定时备份网站文件到七牛云存储脚本
 php重定向的三种方法分享
 CentOS Gnome字体不清晰
 centos 6.5 安装mplayer

原文地址：https://www.cnblogs.com/huanglinsheng/p/7601153.html