python 爬糗事百科

糗事百科网站段子爬取，糗事百科是我见过的最简单的网站了！！！

 1 #-*-coding:utf8-*-
 2 
 3 import requests
 4 import re
 5 import sys
 6 reload(sys)
 7 sys.setdefaultencoding("utf-8")
 8 
 9 url = 'http://www.qiushibaike.com/hot/page/'
10 
11 page = 1
12 
13 urls = []
14 
15 f = open("happy.txt",'w')
16 
17 for i in range(1,10):
18     u = url+str(i) +'/'
19     urls.append(u)
20     # print urls[i-1]
21     html = requests.get(urls[i-1])
22 
23     content = re.findall('<span>(.*?)</span>',html.text,re.S)
24 
25     for item in content :
26         if item[0]!='<':
27             print item
28             f.writelines(str(item)+'

')
29 
30 f.close()

查看全文

相关阅读:
神奇的flex布局
 reset、revert、rebase
Vue.filter过滤器
 moment.js时间格式化总结
 Vue之组件大全
 过滤器filter
Vue之animate
Vue之axios
Mac OS系统上测试PHP代码前的准备工作 | 使用XAMPP搭建Apache服务器的步骤
 Python中的标识符、关键字、变量、语句、注释、模块

原文地址：https://www.cnblogs.com/TreeDream/p/6481225.html