v2的技术控们,集思广益,大家一起来讨论下团购导航网站的技术组成

2012-11-05 16:02:41 +08:00
 acpp
像http://tuan.360.cn/ 这种团购导航站,会自动对其他网站的数据进行搜集 分类
就聊聊这网站技术性的问题吧。比如说如何正确的抓取数据回来 如何判断产品价格和目标站点是否统一 还有就是如何对数据进行分类 大家可以捡自己最熟悉的一个小分类说,如果说的不完善,其他友人再在基础上进行补充
2636 次点击
所在节点    问与答
7 条回复
binux
2012-11-05 16:04:56 +08:00
我不认为360是去抓回来的,而是提供标准接口让其他网站给他提交
acpp
2012-11-05 16:12:52 +08:00
@binux 一般网站在初期的时候,没流量没资源,就提供了接口,也没几个人愿意去提交自己网站的啊,相反,都是有了流量以后,大家才变得积极起来,所以前期的话,不能按照成功后的方法去考虑啊
tuzi
2012-11-05 18:27:16 +08:00
就是采集建站的问题,规划好信息架构,之后针对目标站写好采集规则,入库。做好定时任务,自动更新就行了。有空的话,每天手工审核一下!
markmx
2012-11-05 18:52:52 +08:00
为了看一些特价信息方便。我自己搞个 uh5.cn , 相当与聚合一样,没什么的!
skydiver
2012-11-05 20:43:57 +08:00
@acpp 之前做过一段团购导航网站。其实是团购网站提供了接口的。这个接口的格式有约定俗成的标准,不过忘了是哪家团购网站最先弄的了。团购网站也是希望自己的内容被抓取的,一般联系一下会主动提供接口。
sadara
2012-11-05 21:13:30 +08:00
好多建站程序都支持啊
sp1sp1
2012-11-06 10:52:04 +08:00
网站提供api,它们采集就行了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/51772

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX