Python代理设置教程_requests代理实战

Python中requests设置代理需注意代理类型、格式及报错原因:支持HTTP/HTTPS/SOCKS五种协议,格式为字典;可通过单次传参、Session全局设置或环境变量三种方式配置;需用no_proxy绕过本地地址,验证推荐httpbin.org/ip接口。

Python中使用requests库设置代理很简单,关键在于理解代理类型、格式写法和常见报错原因。

代理的基本格式和类型

requests支持HTTP、HTTPS、SOCKS五种代理协议,最常用的是HTTP/HTTPS代理。格式统一为字典结构:

  • HTTP代理{"http": "http://user:pass@host:port", "https": "http://user:pass@host:port"}
  • HTTPS代理(单独指定){"https": "http://host:port"}(注意:即使代理本身是HTTP,也常需填在https键下,因requests默认对HTTPS请求走https键)
  • 带认证的代理:用户名密码需URL编码,推荐用urllib.parse.quote处理特殊字符
  • SOCKS代理:需安装pysockspip install pysocks),格式如"http://user:pass@host:port""socks5://host:port"

requests设置代理的三种方式

方式不同,作用范围不同,按需选择:

  • 单次请求传参:最安全灵活,只影响当前请求
    requests.get("https://httpbin.org/ip", proxies=proxies)
  • 全局会话设置:适合复用连接、保持Cookie等场景
    s = requests.Session(); s.proxies = proxies; s.get(...)
  • 环境变量方式:无需改代码,适合部署时切换
    os.environ["HTTP_PROXY"] = "http://host:port"
    os.environ["HTTPS_PROXY"] = "http://host:port"

绕过本地网络和常见陷阱

有些代理不希望转发内网或localhost请求,可用no_proxy控制:

  • 设置环境变量:os.environ["NO_PROXY"] = "127.0.0.1,localhost,192.168.1.0/24"
  • requests会自动跳过匹配的域名/IP,不走代理
  • 注意大小写:NO_PROXY必须全大写,且值为逗号分隔,不支持空格
  • 若代理不可用,requests默认抛出ConnectTimeoutProxyError,建议用try/except捕获并降级处理

验证代理是否生效

快速确认代理是否起作用,推荐调用公开测试接口:

  • https://httpbin.org/ip返回当前出口IP
  • https://httpbin.org/headers查看请求头中X-Forwarded-ForVia字段
  • 打印响应内容对比有无代理时的IP差异,比看状态码更可靠

不复杂但容易忽略细节,比如HTTPS请求误配http键、未URL编码密码、忘记装pysocks导致SOCKS失败——逐项检查通常就能解决。