zoukankan html css js c++ java

爬虫之一：爬补天厂商数据（爬虫）

#coding:utf-8
import re,urllib

def gethtml(url):
  page = urllib.urlopen(url)
  html=page.read()
  return html

def getlink(html):

  link = re.findall(r'<td  align="left" style="padding-left:20px;">(.*?)</td>',html)
  #linklist = re.findall(link,html)
  return link

def save(links):
  f=open('360.txt','a')
  for i in links:
    f.write(i+"
")
    #f.close()
    #print 'ok'  

for page in range(11, 200):
  url = "https://butian.360.cn/company/lists/page/" +str(page)
  html = gethtml(url)
  print str(page)+"ye"
  links = getlink(html)
  print links
  save(links)

查看全文

相关阅读:
来自1068
耻辱的时间戳（笑哭）
依然排序
 呵呵
 好吧，第二篇
 来自机房的第一篇博客
 Shader-水流效果
 unity中虚拟摇杆的实现
 (转载)Unity3d中的属性(Attributes)整理
 C#冒泡排序法及优化

原文地址：https://www.cnblogs.com/dongchi/p/5169287.html

热门文章
MyBatis
JPA
JDBC
Spring Cache
Guava Cache
SprintBoot
Spring
Redis
来自中午机房的1071
啊哦！还是语言关