暑假放假在家没什么事情做,所以在学习了爬虫,在这个博客园里整理记录一些学习的笔记。
构建表单数据(以http://www.iqianyue.com/mypost 这个简单的网页为例)
查看源代码,发现name属性值为“name”,密码对应的输入框中,name属性值为“pass”。因此构建表单的数据中要包含两个字段,字段名为“name”,“pass”,字段值设置成对应的需要传递的值。
格式为字典:
{字段名1:字段值1,字段名2:字段值2,...}
下面是代码:
# post请求 import urllib.request import urllib.parse url="http://www.iqianyue.com/mypost/" mydata=urllib.parse.urlencode({ "name":"nihao","pass":"niyehao" }).encode("utf-8") req=urllib.request.Request(url,mydata) data=urllib.request.urlopen(req).read() fh=open("D:/文件夹暑假学习/3.html","wb") fh.write(data) fh.close()
思路:
1.设置好url网址
2.构建表单,并且用urllib.parse.urlencod对数据进行编码处理
3.创建Request对象,参数包括URL地址和传递的数据
5.打开对应的Request对象,完成信息传递
6.然后保存为html文件(可不需要)
由于是初学者,如果大家发现有错,请多多指教。