有一些网站在 chrome 调试里面可以看到后面会几秒就传来一个更新数据一般是 JSON 格式的,几秒就会传来一个,更新网页的。如何才能捕获这个数据呢,并且像浏览器一样一直接收这个数据呢,爬虫是主动请求的,如何才能像 SOCKET 连接那样,没有的时候阻塞在那 有的时候就接收呢? 一直很疑惑这个问题,觉得应该是有办法做到的,能模拟浏览器连接网页吗
1
jakeyfly OP 没有大佬知道吗
|
2
msg7086 2018-05-15 13:07:34 +08:00
你需要的是无头浏览器?
你说的是 WebSocket 连接? |
3
CloudnuY 2018-05-15 13:48:30 +08:00
几秒一个数据包那种难道不是 js 写的定时 ajax 吗……类似心跳包那种
|
4
qwjhb 2018-05-15 14:23:26 +08:00
开 f12 看看 确定没有 POST/GET ?
|