干货Python爬虫如何设置代理IP

avatar
作者
猴君
阅读量:5

在Python爬虫中设置代理IP可以通过使用第三方库如requests或urllib库来实现。以下是一个使用requests库设置代理IP的示例代码:

import requests # 设置代理IP proxies = { 'http': 'http://IP:端口', 'https': 'https://IP:端口', } # 发送请求时使用代理IP response = requests.get('https://www.example.com', proxies=proxies) # 打印响应内容 print(response.text) 

在上面的代码中,将IP端口替换为你的代理IP和端口号。注意,httphttps分别对应HTTP和HTTPS请求的代理设置。

如果你的代理IP需要身份验证,可以在代理IP的后面加上用户名和密码,如下所示:

import requests # 设置代理IP proxies = { 'http': 'http://用户名:密码@IP:端口', 'https': 'https://用户名:密码@IP:端口', } # 发送请求时使用代理IP response = requests.get('https://www.example.com', proxies=proxies) # 打印响应内容 print(response.text) 

同样,将用户名密码IP端口替换为你的代理IP的相关信息。

另外,如果你需要使用多个代理IP,可以使用代理IP池来实现。代理IP池是一个存储多个代理IP的容器,你可以从中随机选择一个代理IP并设置为请求的代理。以下是一个简单的示例代码:

import random import requests # 代理IP池 proxies = [ 'http://IP1:端口1', 'http://IP2:端口2', 'http://IP3:端口3', ] # 随机选择一个代理IP proxy = random.choice(proxies) # 发送请求时使用代理IP response = requests.get('https://www.example.com', proxies={'http': proxy}) # 打印响应内容 print(response.text) 

在上面的代码中,proxies是一个代理IP池,你可以在其中添加多个代理IP。然后,使用random.choice函数从代理IP池中随机选择一个代理IP并设置为请求的代理。注意,这里只设置了HTTP请求的代理,如果你需要同时设置HTTPS请求的代理,需要在proxies中添加对应的代理信息。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!