http://ww2.sinaimg.cn/large/74cae53fgw1er9qef10uvj21iu08641q.jpg
遇到这些数据如何post(校园网爬虫)
1
lk09364 2015-04-18 15:17:48 +08:00
base64,不是的话分析JS 啊。
|
2
mV2GK 2015-04-18 15:30:10 +08:00
应该是base64编码后的。。。
|
3
Septembers 2015-04-18 16:53:54 +08:00
|
4
Comdex 2015-04-18 19:22:30 +08:00
正方教务系统?
|
5
zts1993 2015-04-18 19:34:58 +08:00 via Android
ViewState
先抓取页面上的ViewState使用同样的Cookie信息登陆, |
7
insaneDream OP @Comdex 嗯。。。是的
|
8
latteczy 2015-04-18 21:14:12 +08:00
直接复制,然后post就行
|
9
insaneDream OP @latteczy 试过。。。不行。。。
|
11
donghouhe 2015-04-19 01:06:19 +08:00 via Android
http头host有没有加?python默认不带host
|
12
pi1ot 2015-04-19 01:17:09 +08:00
末尾带等号的字母数字多半是BASE64
|
13
lincanbin 2015-04-19 01:25:02 +08:00 1
viewstate
asp.net里的,是form校验用的,不是不标准的base64,解码后也只是form的内容,所以没有必要解码。 抓取登录页的input里的这些数据后原样提交。 |
14
lincanbin 2015-04-19 01:25:23 +08:00
不是标准的base64
|
15
zsx 2015-04-19 10:37:00 +08:00 1
ASP.NET的WebForm各种神奇的内容挺多的=_=
我记得我的做法是第一次访问时匹配<input type="hidden" name="__XXXX"的隐藏域取出value,然后保存Cookie里所有数据。以后再抓取时,把页面的特殊参数填好后,直接加上这些保存好的数据作为验证即可。 |
16
Septembers 2015-04-19 11:55:00 +08:00 via Android
@zsx 我当时折腾的时候被这个差点搞疯,检查参数相当多,还要维护很多状态
|