一个服务器只有几台,最大内存不到 16G 的软件公司还想搞爬虫大数据,这算什么样的公司

2017-04-24 14:36:02 +08:00
 cnfzv

一个服务器只有几台,最大内存不到 16G 的软件公司 想搞爬虫、大数据,抓取的数据库主要用 SQLSERVER 。 搞数据抓取的只有一个新人,这算什么样的公司

18144 次点击
所在节点    程序员
97 条回复
ipoh
2017-04-24 16:56:26 +08:00
@cnfzv 用百度的码农凭什么抱怨啊,努力还不够
killerv
2017-04-24 16:59:33 +08:00
多大的业务? 16G 应该够了啊
cnfzv
2017-04-24 17:09:31 +08:00
@killerv 只是爬虫 8g 都够了,可惜还有很多乱起八糟的东西跑着,而我也不只是去弄开发。我只是心情很不好,而这个公司发展方向确实也不太好,他们主要靠业务吃饭,开发并不重要。
klxq15
2017-04-24 17:10:59 +08:00
大数据也没规定多大数据就算大数据啊。。。
jayong
2017-04-24 17:18:46 +08:00
@ipoh 哼 我用神马
we3613040
2017-04-24 17:24:51 +08:00
听着挺爽的,不过就是发展不怎样,混日子还行
Felldeadbird
2017-04-24 17:28:20 +08:00
8G 的服务器,足够你用爬虫了。只是带宽出口 1M ,太少了。估计爬起来效率很低。你另外还有 2 台服务器,可以让他们做爬虫业务。反正我司 1U1G 100M 的服务器,每天爬 100 万的数据都没任何压力、一部分展示业务也在这台机器上进行。楼主自己做参考。
bk201
2017-04-24 17:29:13 +08:00
window 这内存不够吧, linux 倒是可以。
eDeeraiD0thei6Oh
2017-04-24 17:29:23 +08:00
一个小目标 我觉得楼主多虑了
cnfzv
2017-04-24 17:30:42 +08:00
@Felldeadbird redis 队列,数据库、爬虫都在这一个 8g 上面,另外两个机器也跑着爬虫,但是得用这个机器入库,另外两个机器跑不动 redis
Felldeadbird
2017-04-24 17:32:31 +08:00
补充一点,服务器数据是定时删除的。如果楼主公司业务需要展示以前的数据,在数据大了的情况下,单机肯定是不够用的。但是不论怎样也好。刚开始的时候,数据量不大就别去担心硬件这个事情了。等到不够用的时候,直接向上面申请。他们不审批也没关系,让他们继续等待缓慢的服务……
brucedone
2017-04-24 17:43:01 +08:00
很好奇一个爬虫,后面没有跟着算法等数据专家, 能搞成什么样的大数据。
hundan
2017-04-24 17:47:11 +08:00
我觉得楼主这样完全可以单干,自己开公司……
jiangzhuo
2017-04-24 17:52:46 +08:00
16G 没什么问题吧,如果爬垂直领域的, 32 台 500M 的爬虫也挺好,另外谁有国内比较便宜的代理池子给推荐一下。
yohole
2017-04-24 18:19:46 +08:00
@crab 我爬过 V2 ,一台最普通的 PC 爬个两天,基本搞掂了
gamecreating
2017-04-24 18:30:02 +08:00
跟机器有关系吗? PC 电脑一样采集..
lyhiving
2017-04-24 18:52:07 +08:00
有内幕,估计就是爬了“大数据”三个字
fermiz
2017-04-24 18:57:21 +08:00
我们学校给论坛的都 64G 。。。。
coreos
2017-04-24 19:05:01 +08:00
@cnfzv 做着做着,做明白了,就大牛了。
SlipStupig
2017-04-24 19:10:14 +08:00
2G 内存+2Core 每天抓取上千万的电商数据.....

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/356982

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX