对于 Python 爬虫遇到一个问题，对于这样一个网站： www.icgoo.net，它好像是异步加载的，需要的型号数据在 XHR 里的 html 语句里，设置了 csrftoken。请问要什么方案爬取比较好呢？先谢谢打大家了

2018-03-13 17:14:24 +08:00

sr0miao

3797 次点击

所在节点

Python

11 条回复

cdwyd

2018-03-13 17:23:24 +08:00

获取 csrftoken 然后抓就是了

sr0miao

2018-03-13 17:29:39 +08:00

@cdwyd 请问如何获取呢

Mojy

2018-03-13 17:48:19 +08:00

最简单的方式是通过模拟浏览器的方式进行爬虫，缺点就是稍微有点慢，需要等到页面加载完成才好

cokky

2018-03-13 18:07:07 +08:00

用 phantomjs 模拟浏览器方式来试试

Nick2VIPUser

2018-03-13 18:11:25 +08:00

点进 chrome 里面的 Source，到?partno=ADIS16251ACCZ&qty=1 这个 page 里面搜索 token 字段，把 token 出现的地方打断点调试，边调试边读 js 代码的实现，token 初始值多少经过什么代码变成了什么样子，最后算出来是多少。然后使用 python 代码实现～