写了一个方正教务系统的爬虫,踩了一些坑。

2018-03-11 23:41:02 +08:00
 zyqf

一些信息没有打码,请不要喷我。

教务系统网站: http://211.83.241.81/jwglxt/xtgl/login_slogin.html

感谢 https://www.v2ex.com/t/433971#reply11 几位经验丰富前辈的指点,才让我少走了些弯路。

有一些坑,主要是 Cookie 会话保持,以及密钥与时间参数的关系等等。

代码写的较丑,就不敢开源了。。。。

11441 次点击
所在节点    Python
65 条回复
watzds
2018-03-11 23:45:31 +08:00
表格不错
zyqf
2018-03-11 23:56:24 +08:00
@watzds 表格是用的 Texttable,IDE 中输出会导致表格错乱。后来调试半天,才去看了源代码,发现应该是全角和半角中文宽度计算的问题。
scnace
2018-03-12 00:10:34 +08:00
之前年轻的时候写过一篇很中二的文章 233

https://blog.scnace.me/一次爬方正教务处的成功实践 /
zyqf
2018-03-12 00:15:48 +08:00
@scnace 我们教务处正在从您这篇文章的版本迁移到新的版本,据说是 Java 写的。还有 2017 年,今年 2018,年轻的时候???? 黑人问号.jpg
scnace
2018-03-12 00:16:54 +08:00
@zyqf 是啊 工作一年感觉老了很多啊
epkT6QJ3RSaz6AnJ
2018-03-12 00:19:57 +08:00
我记得正方教务有个提权漏洞,之后上传 ashx 后就有了 webshell,可以脱裤
epkT6QJ3RSaz6AnJ
2018-03-12 00:20:28 +08:00
表名都是拼音吓尿
XIVN1987
2018-03-12 00:53:30 +08:00
界面挺漂亮,,赞
chinvo
2018-03-12 01:06:47 +08:00
@zyqf #4 朋友之前在正方做项目实施经理,旧版的写的真是稀烂,在浪潮的云平台上,开 32 虚拟核机器,选课时有个后台进程会频繁挂起,最后解决方案是开 64 虚拟核的机器

(虽然很大原因是浪潮云平台之前不能绑定虚拟核到物理核
kingcos
2018-03-12 01:12:20 +08:00
……问一下,正方的课表难道不是跟青果一样,绘制的图片吗……
青果的还故意加了躁点防 OCR …
azh7138m
2018-03-12 01:13:47 +08:00
@zyqf 刚迁到新版 Java 的话,那你要抓住机会,看下图片请求如果是学号做参数的话,是没有做校验的,建议爬取学校妹子多的院
azh7138m
2018-03-12 01:17:12 +08:00
顺便说下,如果学校的图书是老汇文的话,是可以直接 getshell,里面会有性别和学号,配合一下就能:D
oswuhan
2018-03-12 02:46:48 +08:00
半个校友……这个正方系统看起来好高端……
tsui
2018-03-12 04:05:58 +08:00
主贴就一个 terminal 截屏啊。。你们都看到的什么界面 table 的。。
steveway
2018-03-12 07:15:15 +08:00
我也做过相关的 不过我更偏向于抢课 post 的发送
项目中的 cookies 是怎么保存的?
zyqf
2018-03-12 07:59:46 +08:00
@azh7138m 已经做了权限控制,我第一件事情就是干这个。。。
zyqf
2018-03-12 08:02:29 +08:00
@steveway requests.session(),自动管理 Cookies
zyqf
2018-03-12 08:03:20 +08:00
@steveway 再回复下,只要登陆进去,选课,查成绩都能做。
zyqf
2018-03-12 08:04:22 +08:00
@chinvo 难怪旧版的教务系统,一到选课的时候就崩了。
jydeng
2018-03-12 08:10:04 +08:00
@epkT6QJ3RSaz6AnJ 似乎是 12 年时候的事情

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/437081

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX