有个爬虫问题,请教大家

2019-03-17 16:44:22 +08:00
 herozzm

http://www.pyggzy.com/list.asp?class=25
这个地址,用 postman 可以抓取到信息,但是用 php 的 file_get_contents 或者其他语言的 get 都访问失败,找了半天没发现是什么原因?

1058 次点击
所在节点    问与答
5 条回复
uyhyygyug1234
2019-03-17 16:49:13 +08:00
f12 copy as curl 可以啊
herozzm
2019-03-17 17:04:13 +08:00
@uyhyygyug1234 php 的 file_get_contents 不行,不知道什么原因
herozzm
2019-03-17 17:38:24 +08:00
有人帮看看 找不到原因
yanwen
2019-03-18 01:39:06 +08:00
你看看是不是限制了 user agent 了,是的话就伪装一下
herozzm
2019-03-18 08:35:43 +08:00
@yanwen 并不是 postman 里面没有添加任何 header

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/545511

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX