24 时跑爬虫程序,硬件自己组装, v 友们可有推荐

2016-07-30 16:34:22 +08:00
 liangmishi
预算 2000 。
能跑 scrapy 框架写的程序就可
主要担心的还是长时间运行,硬件受不了。
跪求推荐。。
20428 次点击
所在节点    程序员
54 条回复
shijingshijing
2016-07-30 21:43:29 +08:00
@UnisandK 独服远程的话网络稍微不行就不好控制,本地的话还可以顺便再买两个大硬盘给大姐姐们住。
shijingshijing
2016-07-30 21:44:47 +08:00
@liangmishi 开多线程爬的时候,还是选低频多核带超线程的,肉测过,这个比高频少核的要 NB
liangmishi
2016-07-30 21:45:05 +08:00
@yeshang 兴趣,爬什么不重要,可能是微博
@gainsurier 感觉树莓派 hold 不住
@lan894734188 没看懂。。哥。。。
@UnisandK 是的,但是这个以后还会有用处的,比如放在家做做备份,或者其他,主要还是考虑到硬盘存储的原因,租的硬盘很小
liangmishi
2016-07-30 21:50:09 +08:00
@shijingshijing 非常感谢!!! 顺便给大姐姐们住~
现在感觉你 HP 的 Gen 8 正好到我的预算,如果再加内存和硬盘,这预算就超得有点多了
lan894734188
2016-07-30 22:00:45 +08:00
@liangmishi 服务器 配置 加起来 1k 不到吧
airqj
2016-07-30 22:10:44 +08:00
爬虫又不计算密集型
把钱用在内存上
dongfang
2016-07-30 22:31:32 +08:00
这种 24 小时开机情况,不应该用服务器吗?
阿里云、腾讯云等等很多呀。
liangmishi
2016-07-31 00:07:55 +08:00
@lan894734188 您说的服务器是指云服务器吗,如果以长远来考虑还是自己组装来得划算,毕竟我只是需要向外访问,不需要外网能访问进来
@airqj 谢谢,提醒了我,没错,爬虫确实不是计算密集型的~感谢
@dongfang 云服务器不划算的,如果硬盘要加大点就会显得很贵
3dwelcome
2016-07-31 00:14:08 +08:00
我以前也考虑过, arm linux/android 或 intel atom cpu 平台比较合适,可以长期低功耗的运行,无风扇也挺稳定的。前提是你抓取后,并不需要大数据加工处理。

爬虫 only 的,上传统台式机总觉得没啥必要。。
UnisandK
2016-07-31 00:19:19 +08:00
@liangmishi 这是 KS-4C 优惠版的配置,现在收一个大概 350 软的样子,做了免税续费是 11 欧每月,机房有加拿大和法国


当然 2TB 硬盘依然觉得小的话那就没办法了
em70
2016-07-31 00:22:53 +08:00
市面上的云服务器上行带宽都是不限且免费的,不用这个跑爬虫,还自己搭建?
3dwelcome
2016-07-31 00:24:59 +08:00
云服务器 IP 是固定的,比如我以前爬 google map, 一段时间会封你的 IP ,在自己家搭建机器用 adsl ,重新拨号就换了个动态 IP ,比机房好,呵呵。
liangmishi
2016-07-31 00:35:16 +08:00
@UnisandK 果然不错性价比很高,其实我不只是有爬虫这个需求,如果以后不做爬虫了,这些硬件还可以改装成其他玩意,很好玩的,比如做个监控,比如可以放在家里可以控制某些智能的家具(虽然现在还没有)

@em70 爬虫只需要能访问公网即可,市面上的服务器我也买了个,专门用来跑 web 还不错
@3dwelcome 感觉自己搭建服务器很爽有没有~
harry890829
2016-07-31 00:41:23 +08:00
我就问下,买个家用服务器是不是就不需要 nas 了?
Marfal
2016-07-31 02:30:18 +08:00
楼主你还是上云吧,按小时付费的那种,等发现确实需要再买硬件或者是租独服,这样下来花不了多少钱也不用在这纸上谈兵。
moosoome
2016-07-31 09:15:07 +08:00
@Marfal 做爬虫上云的话还买可切换 ip 的 vps ,配置代理池,非商用爬虫的话还是自建吧
xiaocsl
2016-07-31 10:03:37 +08:00
@em70 并不是这样,我之前也这么认为,自从花钱买了美团云.
em70
2016-07-31 10:40:14 +08:00
@xiaocsl 我跟你保证阿里云和 linode 都是上行带宽无限且免费
unfurl
2016-07-31 10:49:42 +08:00
intel nuc 怎么样?
SmiteChow
2016-07-31 11:16:04 +08:00
@em70 你说的是下行吧,上行怎么可能无限。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/296011

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX