请教一个关于淘宝商品详情实时获取问题?

2017-03-23 20:43:16 +08:00
 polandeme

如题,类似于什么值得买,豆瓣东西等商品聚合类网站,提交一个商品 url 就可以拿到商品详情信息。

想问一下他们是爬虫还是内部公司之间的合作?

如果是爬虫,必须渲染 js 才可以拿到部分数据,但是我用 phantomjs 去做渲染,可以拿到数据,但是至少 10s,是不是有更好的解决方案?

PS: 淘宝原先的 API 已经关闭了

2043 次点击
所在节点    程序员
5 条回复
knightdf
2017-03-23 21:13:34 +08:00
想要快只能去 hack 接口了把
waczx
2017-03-24 11:54:32 +08:00
淘宝和京东可以在 jsonp 里面取一些商品信息。
cncqw
2017-03-24 13:33:31 +08:00
目测用的是爬虫,定时抓取,然后提交 URL 后从自己数据库查,不然不可能那么快。
polandeme
2017-03-24 13:42:42 +08:00
@waczx jsonp 应该做了一些反爬虫,发现模拟请求也老是得不到,请指教一二,谢谢
polandeme
2017-03-24 14:26:51 +08:00
@cncqw 这么多商品信息,这也太大了吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/349843

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX