请问计算机二级网站这种反爬虫手段是什么,如何绕过?

2020-04-26 16:21:12 +08:00
 Mikahe

已知计算机二级网站网站为:

http://search.neea.edu.cn/QueryMarkUpAction.do?act=doQueryCond&pram=results&community=Home&sid=300

浏览器可以正常打开

但是通过 python requests.get()打开为一个 js 脚本?

请问这是个什么原理?

2615 次点击
所在节点    问与答
9 条回复
Mikahe
2020-04-26 16:24:37 +08:00
而且是返回的是:返回状态 :412 Precondition Failed (接口异常,请检查接口异常日志)
mlxj
2020-04-26 16:25:44 +08:00
一些信息没有加,比如 Referer
eGlhb2Jhb2Jhbw
2020-04-26 16:27:53 +08:00
问题不知道,不过这网站是教育部的,搞的时候小心了
Mikahe
2020-04-26 16:30:11 +08:00
@mlxj 我的 referer 跟 chrome 上面的一模一样的
yan5990853
2020-04-26 16:31:13 +08:00
不怕出事?
Mikahe
2020-04-26 16:31:56 +08:00
@yan5990853 就想脚本查一下成绩,,,不会有太大流量的
clague
2020-04-26 16:34:10 +08:00
可能是 js 脚本加载的,还是用 selenium 吧
zdnyp
2020-04-26 16:43:43 +08:00
盲猜是因为 cookies,而且要查询的话,你的目标页面也不是这个
Mikahe
2020-04-26 20:01:00 +08:00
@zdnyp 好像确实是因为 cookies,正在想办法

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/666312

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX