zoukankan html css js c++ java

【原创】python爬虫获取网站数据并存入本地数据库

#coding=utf-8
import urllib
import re
import MySQLdb
dbnumber = MySQLdb.connect('localhost', 'root', '*******', 'dbname')           #连接本地数据库
cursor = dbnumber.cursor()
def getHtml(url):
    page=urllib.urlopen(url)
    html=page.read()
    return html

def getnumber(html):
    reg=r'm>(d+)<'         #通过正则表达抓取网站数字
    number=re.compile(reg)
    numberlist=re.findall(number,html)
    return numberlist
html=getHtml("http://baidu.lecai.com/lottery/draw/list/50?type=range_date&start=2005-06-08&end=2003-02-23")          #目标网站页面

for i in range(10000):           #设置一个循环
    try:
        n = 7 * i
        sql_insert = "INSERT INTO dbnumber(red_1) VALUES(%s)" %getnumber(html)[n]            #将获取的数据存入本地数据库
        cursor.execute(sql_insert)
    except Exception:
        break
dbnumber.commit()
dbnumber.close()             #最后关闭数据库连接

查看全文

相关阅读:
数据库mysql中`的作用
 省，市，区三级下拉框联动以及localStorage当做缓存优化
 仿头条新闻app，实现下拉刷新，上拉加载分页
 js获取checkbox多选表单
 这两天的工作：webApp接口对接开发
 我做的一个考试资料app的控制器和后台
 我做的cms后台管理1，商业网站
 thinkphp简单后台cms的操作逻辑
 thinkphp后台登陆自动监测方法_initialize
topthink有时间看看

原文地址：https://www.cnblogs.com/huangxiaocheng/p/7200390.html