新浪微博的登陆现在是越来越那个了,以前的模拟浏览器登陆新浪微博貌似也越来不管用了
登陆信息由以前的form变成了现在javascript,javascript的加载居然用了一个javascript的函数加载,真是。。。。。
可是突然发现,新浪微博的加强仅限于微博,其他的新浪产品还是一般的网页
相信大家也知道,只要在一个新浪的产品登陆,然后自然的就可以不用登陆就可以登陆上其他产品了
1:安装python的模拟浏览器module,这里用的是mechanize,自己百度下载安装就好了,这不懂的话没必要继续看下去了(开玩笑,可以评论,我教你^_^)
2:登陆新浪通行证
3:登陆新浪微博
4:在新浪微博中搜索
在最后有我自己实现的python代码:
这里说点其他的:
1:怎么拿到自己浏览器的cookie,我拿chrome浏览器作为例子:
打开http://login.sina.com.cn/signup/signin.php?entry=sso,按下F12,点network,然后输入账号密码登陆,加载完后点击左边的链接,然后右边的点击headers,找到cookie填到下面代码的对应cookie的位置就好了
2:登陆新浪微博一般是扒数据,微博的搜索框是一个重要来源,不拿发现,中文的搜索中的中文是经过编码的,自己对比一般网页的url编码,不难发现新浪微博的url编码对中文的utf8编码还加了25,自己加上就好了
3:其他的也没什么难的了,
#*-* coding:utf-8 *-* import mechanize import cookielib import urllib import sys br = mechanize.Browser() #cookie jar cj = cookielib.LWPCookieJar() br.set_cookiejar(cj) #加上各种协议 br.set_handle_equiv(True) br.set_handle_gzip(True) br.set_handle_redirect(True) br.set_handle_referer(True) br.set_handle_robots(False) br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(),max_time=1) #加上自己浏览器头部,和登陆了通行证的cookie br.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36'), ('Cookie','在这里把自己的cookie放在这里,很长的一串东西') ] # for f in br.forms(): # print f # br.select_form(nr=0) # print br # br.form['username']='13580491531' # br.form['password']='buhui1314iliting' # br.submit() # br.add_password('http://login.sina.com.cn/signup/signin.php?entry=sso','13580491531','buhui1314iliting') #登陆新浪通行证 br.open('http://login.sina.com.cn/signup/signin.php?entry=sso') t = br.response().read() f = open("ht.html","w") f.write(t) f.close() #登陆新浪微博 br.open('http://weibo.com') t = br.response().read() f = open("htm.html","w") f.write(t) f.close() #输入查询关键字 tips='请输入查询关键词,按回车键结束:' # tips = tips.decode('utf-8') query = raw_input(tips) #对查询进行url的utf8编码,中文才需要编码,英文不需要 #sys.stdin.encoding表示系统默认的编码 query = urllib.quote(query.decode(sys.stdin.encoding).encode('utf8')) #新浪微博的查询是在url的utf8编码的基础上在%后加上25 query = query.replace('%','%25') #print query br.open('http://s.weibo.com/weibo/'+query) print br.response().geturl() t = br.response().read() f = open("html.html","w") f.write(t) f.close()