用 python 爬取什么值得买网站返回 403，爬其他网站的时候返回 200，这个是怎么回事？

2015-04-20 17:28:52 +08:00

yangguang31466

代码请求头里面加了user-agent,请求其他网站没有问题！

4145 次点击

所在节点

9 条回复

yangguang31466

2015-04-20 17:52:54 +08:00

被服务器拒绝了，怎么才能解决这个问题？

NewYear

2015-04-20 18:04:49 +08:00

这个站长好像也是V2的人……

Tink

2015-04-20 18:08:05 +08:00

从rss试试

learnshare

2015-04-20 18:10:34 +08:00

防爬虫做的不错

wibile

2015-04-20 19:07:30 +08:00

可以啊，试了试没问题的，加上cookie就行了。另外好像都是奇数的帖子，如667459，667409，667387

jas0ndyq

2015-04-20 19:27:37 +08:00

没伪装成浏览器？

binux

2015-04-20 19:33:37 +08:00

现在张大妈的反爬虫做得不错，用了一个和 IP 相关的，需要执行 JS 生成的 cookie 来验证。

kchum

2015-04-20 20:16:59 +08:00

Selenium.

yangguang31466

2015-04-27 16:49:52 +08:00

加上cookie后就可以了！

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

用 python 爬取 什么值得买网站 返回 403，爬其他网站的时候返回 200，这个是怎么回事？