zoukankan html css js c++ java

反爬虫2（代理ip）

在进行爬虫访问时，被访问主机除了会校验访问身份，还会校验访问者的ip,

当短时间同ip大量访问时，主机有可能会拒绝返回，所以就现需要代理ip,

百度中可以获取到大量的免费的代理ip(ps:注意在访问一些隐私的内容时尽量少用免费代理ip，而且部分代理ip是无法使用的)

代理IP是使用方法如下：

from urllib import request
import random
import re

#反爬虫方法2
#代理ip爬取
proteslist=[
    {"http": "1.197.203.225:9999"},
    {"http": "1.197.203.225:9999"},
    {"http": "1.197.203.225:9999"},
    {"http": "1.197.203.225:9999"},
]
protes=random.choice(proteslist)
print(protes)


#构建代理处理器对象
protesHandler=request.ProxyHandler(protes)
#构建opener
opener=request.build_opener(protesHandler)
url="https://www.cnblogs.com/yongqi-wang/p/python_pachong.html"
header={
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"}

#创建模拟浏览器请求对象
req=request.Request(url,headers=header)
#发送请求
res=opener.open(req)
print(res.read())

查看全文

相关阅读:
LVS-三种负载均衡方式比较
 keepalived和heartbeat区别
 vmware-question
SQL Server MYSQL 检查点的好处
 MYSQL 引擎的情况
 MYSQL 关闭服务的过程
 SQL Server 行的删除与修改-------------（未完待续P222 deep SQL Server 222 ）
SQL Server一些重要视图 1
SQL Server 查看数据页面
 SQL Server 向堆表中插入数据的过程

原文地址：https://www.cnblogs.com/yongqi-wang/p/python_pachong.html