qunar; 爬虫;遇到 wyf 参数和_token 参数,如何获取??

2015-05-25 22:23:44 +08:00
 1oscar

爬qunar的机票网页,遇到需要wyf参数和_token参数,如何获取


1. 打开 http://www.qunar.com/,随便选择出发站到达站
2. google开发工具,network里的longwell?******链接里
3. headersRequest URL:需要这两个个参数,

wyf:uJb7S3JT6lF7EzJEzm+dTzAbuN+w23JEuqFdl+3vlNJ7l+ob|1432560216540
_token:91951

发现这两个参数对于不同的行程是在变化的,不知道怎么获取到呀

求助朋友们指教下

3959 次点击
所在节点    Python
10 条回复
kslr
2015-05-25 22:26:31 +08:00
csft_token ?
y....
w88975
2015-05-25 22:42:38 +08:00
一般这种token,是存在于html页面的源码里面,请求页面的时候,把源码中的token用正则取出来就好
1oscar
2015-05-25 23:50:43 +08:00
@w88975 token是小事,主要是wyf参数网页里没找到呀
1oscar
2015-05-25 23:51:39 +08:00
@kslr 不是的,主要是wyf参数值不知道怎么来的
facat
2015-05-26 01:12:29 +08:00
为什么要爬这两个值?你直接爬机票就可以了。我就爬过。不过用的是phantomjs,但是原理一样。
crab
2015-05-26 03:18:53 +08:00
wyf 参数从这 http://qunarzz.com/flight/prd/scripts/v4_oneway_list@*.js 浏览器的 UA 吧 ?
1oscar
2015-05-26 08:25:25 +08:00
@facat 直接爬机票是可以,只是爬下来数据总是有些缺失,所以感觉可能和这两个参数有关
1oscar
2015-05-26 08:28:34 +08:00
@crab 主要是那段js代码没看明白
facat
2015-05-26 11:09:38 +08:00
@1oscar 用phantomjs吧,qunar用了很多ajax,直接爬不方便。
1oscar
2015-05-26 20:44:53 +08:00
@facat 谢谢你

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/193682

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX