闲着无聊想爬小说网

2020-03-31 14:56:49 +08:00
 hejunxin

我发现现在好多小说网 都使用网页内嵌“阅读器”的方式进行展示 ,请问这种内容可以使用什么方式获取呢

2277 次点击
所在节点    问与答
14 条回复
127000
2020-03-31 16:10:05 +08:00
legado.top/MyBookshelf
自定义书源的小说阅读 APP
zdnyp
2020-03-31 16:25:04 +08:00
你需要先发一个网址出来
soulzz
2020-03-31 16:45:56 +08:00
截图+tess4j
hejunxin
2020-03-31 17:49:34 +08:00
wdy3334
2020-03-31 17:52:46 +08:00
@127000 #1 这个好用啊,之前一直用,后来换了 ios 找到另一款差不多的,就是广告太多
xiaobai332
2020-03-31 18:09:24 +08:00
这种难道不是直接获取网页,然后把 span 标签裁剪一下吗!?
xiaobai332
2020-03-31 18:14:21 +08:00
一楼发的软件,可以通过定义好的书源获取小说,也可以自己写一个爬虫,根据书源获取小说,一样的原理
Xusually
2020-03-31 18:31:11 +08:00
监狱警告⚠️
heygum97
2020-03-31 19:08:48 +08:00
@hejunxin 网页挺流畅的感觉跟 app 一样。
zdnyp
2020-04-01 09:10:09 +08:00
这...内容不是在源代码里吗?直接请求就可以了吧
hejunxin
2020-04-01 09:51:47 +08:00
@zdnyp 恕我眼拙 源代码里没有找到, 还请兄台指点迷津~
zdnyp
2020-04-01 10:09:10 +08:00
@hejunxin 仔细看看,源代码
chaneyccy
2020-04-01 10:21:40 +08:00
div class = 'read-content j_readContent'
不过页面上写了"版权所有,侵权必究",还是别爬了吧,容易吃警告
hejunxin
2020-04-01 10:42:34 +08:00
@chaneyccy
@zdnyp
找到了 我以为没有呢 谢谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/657949

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX