最近在试着爬银行帐单的网页,需要 Login
Login 是一个 AJAX 的 POST ,在用 Chrome 抓包分析了 Header 跟 Payload 之后,用 POSTMAN 验证了
header 需要
X-Requested-With
User-Agent
Content-Type
Payload 需要
requestTimestamp
user
password
用 POSTMAN 加上以上字段进行试验,可以得到 200 的返回,一切正常
后用 Python 的 Requests 库写了一个爬虫 用了 Session
s = requests.Session()
r =
session.post(login_url, params=login_payload, headers=login_header, allow_redirects=True)
login_payload 和 login_header 里的数据与 POSTMAN 里用的一样,但是却是 500 的返回
想请教一下排查思路,如果做法有误也请不吝指出
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/248177
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.