爬虫需求后期会很大,速度要快
1
summerwar 2018-08-27 23:34:32 +08:00
信息太少,没法推荐
|
2
ToT 2018-08-27 23:46:19 +08:00
能不能提供一些基本数字估计。当你写出来的时候,可能也就知道答案了。
参看 http://highscalability.com/blog/2011/1/26/google-pro-tip-use-back-of-the-envelope-calculations-to-choo.html |
3
hundan 2018-08-28 00:22:34 +08:00 via Android
借楼问一下,如果要做扫全球 ip 这种大流量出口的工作,有没有好的推荐,不会被封不会被警告的,出口带宽大的
|
4
msg7086 2018-08-28 04:25:57 +08:00
|
5
studyaa OP @msg7086
五六个小时要跑几千万数据, ip 肯定要频繁换,多少个的话我也不太清楚怎么算,一个首页面一个?几十万个? 分布式不太懂 国外的不需要 价钱的话公司没说,就说做下来所需要的配置.. 还有感谢回答! |
6
studyaa OP |
9
tennc 2018-08-28 14:51:09 +08:00
正规的服务器跑爬虫都会被封吧,要找就找那些 black 服务器
|