V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
lsls931011
V2EX  ›  程序员

一直使用追书神器看小说,大家知道追书神器是用什么做爬虫的么, Python ? Java ?Go

  •  
  •   lsls931011 · 2018-01-17 12:40:43 +08:00 · 7913 次点击
    这是一个创建于 2533 天前的主题,其中的信息可能已经有所发展或是发生改变。
    39 条回复    2018-01-18 16:16:48 +08:00
    araraloren
        1
    araraloren  
       2018-01-17 12:47:21 +08:00
    Who care.
    rensuperk
        2
    rensuperk  
       2018-01-17 12:48:50 +08:00
    python 最简单!
    xomix
        3
    xomix  
       2018-01-17 13:06:32 +08:00
    php 吧,当年似乎有过出错输出的时候,现在?鬼知道。
    xiandao7997
        4
    xiandao7997  
       2018-01-17 13:07:55 +08:00
    知道了然后呢
    jokerjoker
        5
    jokerjoker  
       2018-01-17 14:26:58 +08:00
    为什么那么多人喜欢看网文小说
    defunct9
        6
    defunct9  
       2018-01-17 15:03:01 +08:00   ❤️ 1
    网文有毒啊,骚年。终于花了整整一年才戒掉。多看看实体书和多去看看这个世界吧。
    tscat
        7
    tscat  
       2018-01-17 15:04:58 +08:00
    语言压根不是问题吧。
    主要是那些小说站都是固定模板的,你撸一两个就能都爬了。
    猜测的。
    chengzhoukun
        8
    chengzhoukun  
       2018-01-17 15:09:11 +08:00
    @defunct9 #6 看美剧大大减少了我看网文的时间。。。
    fhefh
        9
    fhefh  
       2018-01-17 15:09:45 +08:00
    现在不看动漫了~~~ (ノへ ̄、)捂脸
    ufo22940268
        10
    ufo22940268  
       2018-01-17 15:09:52 +08:00   ❤️ 1
    nodejs + cherryio
    sobigfish
        11
    sobigfish  
       2018-01-17 16:11:26 +08:00
    然而现在他们在努力洗白中,如果 lz 要做这个的话,趁早 or never
    foreverlemo
        12
    foreverlemo  
       2018-01-17 16:14:14 +08:00
    .NET & NODEJS
    tigiyj
        13
    tigiyj  
       2018-01-17 16:17:32 +08:00
    有没有笔趣阁那样的 api 呢?
    chenqh
        14
    chenqh  
       2018-01-17 16:18:39 +08:00
    @defunct9 可是戒不掉啊
    Len1133
        15
    Len1133  
       2018-01-17 16:28:50 +08:00
    10 年左右很多小说网站根本没有反爬,随便 get 一下就出来了。而且 url 也是有规律的,一个网站 1 小时就扒完了。
    jiujiu5151
        16
    jiujiu5151  
       2018-01-17 16:37:29 +08:00 via Android
    我是自己写的追书爬虫,功能完备。android 和 ios 都上架了。APP 一直没有打理,日活很少
    defunct9
        17
    defunct9  
       2018-01-17 16:45:16 +08:00   ❤️ 1
    @chenqh 不容易啊,要不能花掉一年吗。但是这真是个毒草,必须拔掉。
    rocksolid
        18
    rocksolid  
       2018-01-17 17:08:49 +08:00
    @chenqh 看几本经典的,然后你会发现其他的和他们都是一个套路
    chenqh
        19
    chenqh  
       2018-01-17 17:29:50 +08:00
    @defunct9 哎,尝试戒了好多次了..
    nothing2
        20
    nothing2  
       2018-01-17 17:37:11 +08:00 via Android
    @jiujiu5151 哪些小说站文本质量高、更新及时?
    opengps
        21
    opengps  
       2018-01-17 17:41:51 +08:00
    用啥都行,没必要介意
    jiujiu5151
        22
    jiujiu5151  
       2018-01-17 17:55:36 +08:00 via Android
    @hgyhyx 没有针对特定的小说站,先是到起点等网站采集小说名称作者等基本信息。
    然后以 小说名称+章节列表 作为关键词到搜索引擎中搜索,可以提取小说源
    章节列表和正文都是自己写的算法提取的
    所以不用针对特定小说站写采集规则
    ffkjjj
        23
    ffkjjj  
       2018-01-17 18:35:05 +08:00 via iPhone
    @tigiyj 笔趣阁很简单爬,没反爬
    lion
        24
    lion  
       2018-01-17 22:07:50 +08:00
    @jiujiu5151 你的 APP 名称是?
    passion336699
        25
    passion336699  
       2018-01-17 22:10:06 +08:00
    自己爬会不会有啥版权问题啊?
    Jisxu
        26
    Jisxu  
       2018-01-17 22:41:47 +08:00
    @hgyhyx #20 推荐知轩藏书,都是精校版的全本小说
    Robias
        27
    Robias  
       2018-01-17 22:48:44 +08:00
    @jiujiu5151 不怕版权问题?
    nothing2
        28
    nothing2  
       2018-01-17 22:50:30 +08:00 via Android
    @jiujiu5151 谢谢。同问你的 app 名称

    @Jisxu 谢谢。mebook.cc 也不错。知轩都是完结小说,但有时会追一些正在写的
    hlyzh
        29
    hlyzh  
       2018-01-18 02:42:47 +08:00 via Android
    知轩确实不错很多书都是从河洛里搬出来的,质量很高不过现在有反爬了要慢一点。。。以前都没有的随便爬
    4linuxfun
        30
    4linuxfun  
       2018-01-18 08:33:37 +08:00
    网文不都是套路吗?何必看这么多,还是找点其他书看看吧
    harry890829
        31
    harry890829  
       2018-01-18 08:35:06 +08:00
    呃,随便就戒掉了啊……我现在就开车会听,而且不听新的了,都是以前看过的,怀旧,最近正想听得无聊,听点有用的呢
    weer0026
        32
    weer0026  
       2018-01-18 08:39:16 +08:00
    大学看了两年网文,大三突然觉悟发现都是差不多套路,自动戒掉了。。
    580a388da131
        33
    580a388da131  
       2018-01-18 08:39:47 +08:00
    @chenqh 看吐就戒掉了,等到什么时候看书名脑补整部书就不想看了,我现在就没有欲望了。
    Clarencep
        34
    Clarencep  
       2018-01-18 08:46:56 +08:00
    who care + 1.
    xiaozizayang
        35
    xiaozizayang  
       2018-01-18 08:51:36 +08:00   ❤️ 1
    以前写的一个小说搜索以及推荐,目标想做个推荐系统~~开源地址: https://github.com/howie6879/owllook

    友情提示网文有毒,适当看看就好,不要沉迷
    YellowLittleDog
        36
    YellowLittleDog  
       2018-01-18 09:09:55 +08:00 via Android
    网文倒是没看,之前一直沉迷武侠小说,最近看美剧倒是戒了。
    asca
        37
    asca  
       2018-01-18 12:07:41 +08:00
    现在用搜书大师了
    suiyanhehao
        38
    suiyanhehao  
       2018-01-18 16:09:19 +08:00
    @jiujiu5151 发出来我们试试?
    yang2yang
        39
    yang2yang  
       2018-01-18 16:16:48 +08:00
    同意 33 楼
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1242 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 17:56 · PVG 01:56 · LAX 09:56 · JFK 12:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.