V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
panyanyany
V2EX  ›  程序员

[最便宜 vps 列表] 类网站是如何实现的?

  •  
  •   panyanyany · 2016-11-09 15:10:22 +08:00 · 3817 次点击
    这是一个创建于 2915 天前的主题,其中的信息可能已经有所发展或是发生改变。

    http://www.comparevps.com/

    https://lowendstock.com/

    http://vps-list.cryto.net/index.php?action=list

    基本的硬盘、内存这些可以直接从各个 vps 的官网上爬取到,这些格式都是固定的,好好调试下爬虫还是有可能爬到的。

    但是像年付 /半年付,或者 location 这些,格式是不固定的,很难提取。

    而且(有一部分) location 一般是要登录进去,选择具体的 plan 才会出现。难道这个站长还开发了自动登录并提取 location 的爬虫?

    百思不得其解,求 V 友们头脑风暴一下。

    第 1 条附言  ·  2016-11-09 15:47:18 +08:00
    我为什么认为是爬来的呢,因为有个作者说他做这个网站用了 2 天,做出来的时候就已经是有几百条信息了。
    12 条回复    2016-11-15 10:31:03 +08:00
    KKKKKK
        1
    KKKKKK  
       2016-11-09 15:36:37 +08:00 via Android
    所以你的理解里面这些聚合型的网站都是爬虫来的?
    panyanyany
        2
    panyanyany  
    OP
       2016-11-09 15:44:07 +08:00
    r#1 @KKKKKK 呃,如果不是爬来的话,成百上千个网站……难道是手工的?我真是不敢想象了……
    panyanyany
        3
    panyanyany  
    OP
       2016-11-09 15:45:40 +08:00
    r#1 @KKKKKK 主要是有个作者说他做这个网站用了 2 天,做出来的时候就已经是有几百条信息了。
    zhoushiya
        4
    zhoushiya  
       2016-11-09 16:25:35 +08:00
    如果平时都关注这类信息,做站加进去,两天还加不了几百条数据?
    killsting
        5
    killsting  
       2016-11-09 16:27:31 +08:00
    一个好的网站,是需要时间+人力+物力+坚持。

    当然是手动过来的啦!
    xmoiduts
        6
    xmoiduts  
       2016-11-09 16:53:20 +08:00 via Android
    有些聚合网站站长,手里都有 no.1 或者序号一位数的 aff 的。
    wjm2038
        7
    wjm2038  
       2016-11-09 21:55:05 +08:00 via Android
    网站不错,收下
    dven
        8
    dven  
       2016-11-10 00:10:44 +08:00
    我感觉做这种单纯比较并没有太大必要,选择 VPS 或者公有云厂商,放在第一的应该是可用性,其次才是性能和价格,要么, OneAPM 不断告警,整天忙着处理服务器的故障问题,还要不要做其他工作了....
    itlr
        9
    itlr  
       2016-11-10 00:17:51 +08:00
    登陆根本不是问题啊,只要在各网站注册一个账号,完全可以用 webdriver 这样的工具实现自动登陆。
    haocity
        10
    haocity  
       2016-11-10 08:16:53 +08:00
    @dven 对于学生党挺合适的 能用就行 又不太要求太高的可用性
    dven
        11
    dven  
       2016-11-10 09:35:15 +08:00
    @haocity 不重要的东西还好,但是不建议把太便宜的云服务用在生产环境或者重要的开发环境中
    loveminds
        12
    loveminds  
       2016-11-15 10:31:03 +08:00
    @dven 对的,那样可能多出来的运维成本是所节省服务器费用的很多倍
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   904 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:39 · PVG 05:39 · LAX 14:39 · JFK 17:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.