小白今天在写 python requests proxies 的时候发现,请求 https 网站一直提示握手失败,部分代码如下
requests_proxies = {
'http': f"http://{first_proxy}",
'https': f"https://{first_proxy}",
}
last_proxy = s.get('https://ifconfig.me', proxies=requests_proxies, timeout=10).text
,后面才发现本地 clash 开的是 socks5 和 http 代理,没有 https 代理,搜索发现网上有人把 https://改成了 http://,使用 http 代理协议来访问 https 网站可以成功。
于是上网学习一番,发现了下面这两篇文章:(其中第 1 篇文章最主要的是评论部分)
其中第 1 篇文章评论中有一段
techon 2017-02-16 11:04:51
现在来说
HTTP 代理可以支持 SSL ,能够代理 https 网站
HTTPS 代理一般也支持 http
前者为代理协议,后者是应用协议,不可混同一谈
好像解释了 http 代理协议可以用来访问 https 站点,那么对应第 2 篇文章中的应该就是最后面的图
1
AoEiuV020 2021-11-05 15:47:02 +08:00
实际上我就没见过 https 代理,网上的免费代理池试过几个写着 https 代理的节点测试下来也是 http 代理,
|
2
asilin 2021-11-05 15:50:06 +08:00 3
- 早些年之前,HTTP 代理指代理端通过解析客户端传递的 GET/POST 请求,实现 HTTP 层面的代理;
- 后来,HTTP 协议的 CONNECT 方法出现后,客户端就可以通过该方法通过代理端访问任意的 TCP 协议,当然包括 TLS 、HTTPS 等。 为了分区以上两种情况,就有了所谓的 HTTP 代理和 HTTPS 代理。 但是上述两种都有一个问题,即客户端到代理端之间的流量未加密,导致可能被截获、替换等。 为了解决该问题,代理端统一支持之前的两种模式,不再区分,而面向客户端提供了 HTTPS 端口,实现了客户端到代理端的信息加密,也就是后来的 HTTPS 代理。 所以,对于 HTTPS 代理这个概念,可以根据上下文来分析,可能指的是代理端支持代理 https 请求,也可能指的是代理端支持通过 https 请求自身。 |