在抓取京东的评论的时候,会经常出现截断
比如http://club.jd.com/review/851542-0-2-0.html
用scrapy shell "http://club.jd.com/review/851542-0-2-0.html"
查看response.body时发现被奇怪地截断了,而用wget网页下来是没问题的,应该不会是被反爬虫了
在此,求解。。。。
比如http://club.jd.com/review/851542-0-2-0.html
用scrapy shell "http://club.jd.com/review/851542-0-2-0.html"
查看response.body时发现被奇怪地截断了,而用wget网页下来是没问题的,应该不会是被反爬虫了
在此,求解。。。。