Python aiohttp 需要 http/2 支持,怎么办?

2018-10-15 15:00:45 +08:00
 zy8595208

最近写一个爬虫程序,一直用 aiohttp 用的好好的,突然有一天模拟登陆不正常了 查了半天发现是网站换了 http2,所有 http1.1 协议的操作请求都 403 了. 找了半天才发现现在 python 的库基本没什么支持 http2 的,就一个 hyper 可以在 client 端发送 http2 请求. 可这货也是很久不更新了,很多功能不支持,连在 https 上 proxy 都不支持,而且功能少的可怜,很难用. 现在我想请教一下各位,有没有什么好的办法

4082 次点击
所在节点    Python
8 条回复
cnilnhf
2018-10-15 15:04:09 +08:00
思路是,http2 应该有降级模式,不可能只强制使用 http2 协议连接,或许能解决你的问题。
reus
2018-10-15 15:04:35 +08:00
换 go
LokiSharp
2018-10-15 15:06:19 +08:00
requests 手动导入证书就行了 aiohttp 应该也可以的
zy8595208
2018-10-15 15:08:09 +08:00
@cnilnhf 网页页面 http1.1 可以请求打开查看,但是所有的 API 操作请求,都强制 http2 了.
zy8595208
2018-10-15 15:09:14 +08:00
@LokiSharp 证书和 http 协议版本有关系吗
LokiSharp
2018-10-15 15:13:34 +08:00
@zy8595208 #5
https://docs.aiohttp.org/en/stable/client_advanced.html#ssl-control-for-tcp-sockets
看这里,默认是没有导入证书的所以不支持 https 手动指定一个证书就行了
zy8595208
2018-10-15 15:17:13 +08:00
@LokiSharp 现在不是 https 的问题,是被爬的网站必须使用 http/2 协议才能正常模拟登陆操作. 但是 aiohttp 现在还不支持 http/2 协议
LokiSharp
2018-10-15 15:26:36 +08:00
诶,这个站用不支持 h2 的浏览器不会降级么?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/497766

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX