http://vps-list.cryto.net/index.php?action=list
基本的硬盘、内存这些可以直接从各个 vps 的官网上爬取到,这些格式都是固定的,好好调试下爬虫还是有可能爬到的。
但是像年付 /半年付,或者 location 这些,格式是不固定的,很难提取。
而且(有一部分) location 一般是要登录进去,选择具体的 plan 才会出现。难道这个站长还开发了自动登录并提取 location 的爬虫?
百思不得其解,求 V 友们头脑风暴一下。
1
KKKKKK 2016-11-09 15:36:37 +08:00 via Android
所以你的理解里面这些聚合型的网站都是爬虫来的?
|
2
panyanyany OP r#1 @KKKKKK 呃,如果不是爬来的话,成百上千个网站……难道是手工的?我真是不敢想象了……
|
3
panyanyany OP r#1 @KKKKKK 主要是有个作者说他做这个网站用了 2 天,做出来的时候就已经是有几百条信息了。
|
4
zhoushiya 2016-11-09 16:25:35 +08:00
如果平时都关注这类信息,做站加进去,两天还加不了几百条数据?
|
5
killsting 2016-11-09 16:27:31 +08:00
一个好的网站,是需要时间+人力+物力+坚持。
当然是手动过来的啦! |
6
xmoiduts 2016-11-09 16:53:20 +08:00 via Android
有些聚合网站站长,手里都有 no.1 或者序号一位数的 aff 的。
|
7
wjm2038 2016-11-09 21:55:05 +08:00 via Android
网站不错,收下
|
8
dven 2016-11-10 00:10:44 +08:00
我感觉做这种单纯比较并没有太大必要,选择 VPS 或者公有云厂商,放在第一的应该是可用性,其次才是性能和价格,要么, OneAPM 不断告警,整天忙着处理服务器的故障问题,还要不要做其他工作了....
|
9
itlr 2016-11-10 00:17:51 +08:00
登陆根本不是问题啊,只要在各网站注册一个账号,完全可以用 webdriver 这样的工具实现自动登陆。
|