中国裁判文书网 爬虫求助

2017-06-23 09:34:31 +08:00
 zbl430

http://wenshu.court.gov.cn/

裁判文书网最近更新了反爬策略,然后一直没有搞懂,希望大神可以帮忙

url = "http://wenshu.court.gov.cn/List/TreeContent"
data = {
    'Param': '上传日期:2017-06-21 TO 2017-06-22,案件类型:赔偿案件'
}
re = requests.post(url, data=data, headers=headers, timeout=60)

这样已经得不到数据了,即使加了 headers

求大神帮忙!!!

9706 次点击
所在节点    Python
45 条回复
wenziyue
2018-04-10 09:56:32 +08:00
@zc15238092914 好的,我加你吧
zc15238092914
2018-04-10 09:57:14 +08:00
@wenziyue 好的 微信 zhangchenchen123123 qq:1104595182
v5python
2018-04-14 15:52:39 +08:00
@wenziyue 我的也基本解决,大量跑出裁判文书数据呢,现在想弄下它的 app。app 有研究过?大佬。加下我的 qq 吧:390982209。
OxhydrylLithium
2018-04-16 10:45:17 +08:00
@wenziyue 抱歉最近很忙没什么时间看,刚看到你的回复。分析了一下流量发现首先发送的 guid 和 number 必须配对 然后每次都要有上一次有效的 vjkl5 cookie。你看看是不是这方面的问题,除了参数生成过程难发现以外其他的看起来难度很小。
yanmo00
2018-08-08 16:32:14 +08:00
@wenziyue 你好,请问下 getKey()的 js 怎么解析的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/370467

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX