一个可自定义规则爬取绅士漫画站点的应用可有实用性

2016-08-16 04:43:44 +08:00
 PureDark

10 天前突然不知道哪来的兴趣开始研究怎样更便捷地浏览各大绅士站点,大名鼎鼎的 E 绅士自然是首要考虑对象,虽然我知道已有 ehviewer 这样大名鼎鼎的先辈,但是我发现它仍然有局限性,不支持多个站点

于是手痒花了 10 天大概把应用做了出来,主要功能是,本身不带有任何和谐内容,甚至我觉得都可以发 google play ,一切爬站点的规则都可以手填、粘贴 json 、或者通过扫描二维码的方式添加 规则的写法相当简单,稍微解释一下,任何一个有点 html 基础知识的人都能写出来吧,并且可以分享给其他人用

搜索只做了可以适配所有网站的基础搜索,自动补全是从获取的到 item 的 tag 收集

github 主页: https://github.com/PureDark/H-Viewer

目前还差下载功能,下载大概就是做成逐图片保存,这样不会有配额之类的风险,而且也可以适配所有网站 目前测试写的三个站, lofi.e 绅士, g.e 绅士、 wnacg ,目测 nhentai 也很容易写规则,我还是留给有兴趣的人写吧……

Preview

18136 次点击
所在节点    问与答
29 条回复
wjm2038
2016-08-16 05:07:35 +08:00
支持一下
wjm2038
2016-08-16 05:09:58 +08:00
有编译好的坂本么
zhy0216
2016-08-16 05:18:37 +08:00
666666666
wjm2038
2016-08-16 05:55:20 +08:00
话说你用过多多猫么
wjm2038
2016-08-16 05:55:35 +08:00
感觉功能好像
lslqtz
2016-08-16 06:02:54 +08:00
总结一下这个 App 吧:
药丸!
franklinyu
2016-08-16 06:21:43 +08:00
這樣真的好麼?感覺會對服務器造成負擔,到時候紳士關站了就得不償失了。對於有 BT 種子的,還是優先 BT 吧。
Trim21
2016-08-16 06:29:28 +08:00
@franklinyu 其实自用下载下来看负担应该跟你自己手动翻页看是差不多的吧?就怕有人下载了一堆又不看或者直接打包发到别的地方去
ShinCurry
2016-08-16 07:10:19 +08:00
搭车发个东西,小黄本转 EPUB
https://github.com/MoeOverflow/hentaibook
xream
2016-08-16 07:53:59 +08:00
求个 iOS 版
franklinyu
2016-08-16 08:10:24 +08:00
@Trim21 {{8L}}:嗯,我就是這個意思,比如發到自己建立的資源站之類。如果是下一部看一部那當然是沒問題的,說不定還能省那麼一點。
just4test
2016-08-16 08:43:24 +08:00
得加一个共享规则的功能。或者是用二维码共享,或者是直接内嵌商店。
ELLIA
2016-08-16 09:38:46 +08:00
6666~这个有意思~
PureDark
2016-08-16 13:02:26 +08:00
@franklinyu
@Trim21
嗯这个应用操作逻辑就是模拟的网页浏览的操作,对网站的负荷不会比正常用浏览器翻页浏览要高
至于下载也一样,只是把 “点开网页-刷出图片-右键另存为”这个机械化操作自动化了,另外我也不会做成同时七八个线程下,这样反而容易被封 IP ,下载时最多就两三个线程慢慢另存图片
PureDark
2016-08-16 13:07:18 +08:00
@wjm2038 多多猫?听说过,但是还没用过,马上去下来看一下,界面比较简陋,但是感觉这个 siteD 插件框架解耦得不错诶,一个插件可以自定义的地方很多
不过我这个是比较精确地定位为绅士漫画站点的爬取应用,界面是不能自定义的,只能自定义规则,而且允许用户自己编辑站点规则,可以说虽然比 ehviewer 定位要广,但是还是比多多猫要专一点、


@xream ios 版近期就不会有了 233 除非看哪位 ios 开发者有兴趣移植吧,我反正是不会 233


@just4test 生成二维码分享功能可以加,内嵌还是不行的,因为我想洗白这个应用,应用内部不能内置任何可能被审核人员和谐的东西
franklinyu
2016-08-16 15:13:04 +08:00
@PureDark {{14L}}:關鍵是,有些人會因為下漫畫方便了,就下一堆不看
crazyred
2016-08-16 16:39:59 +08:00
所以编译好的版本呢?
PureDark
2016-08-16 17:28:03 +08:00
@crazyred 写完下载功能后再发布
wjm2038
2016-08-16 19:26:52 +08:00
@PureDark 我是在做多多猫插件的,理论上只要有个网站,并且数据有规律,多多猫就可以应用插件来解析
PureDark
2016-08-16 22:24:01 +08:00
@wjm2038 是的,所以可以说这点很好,但是另一方面,对于相同规律的某同一类站点,专门还要开发插件就比较麻烦了,因为说到底就相当于要写个爬虫了、而不管用什么语言的爬虫都可以解析任何有规律的网站、
这应用主要还是把阅读和展示框架,甚至规则的格式都定义好,只需要写简单的选择器就行了,而且可以后期更新(而且说到底根本不关心除了绅士站以外的站点 233 ,展示逻辑都不一样,比如普通的漫画就没有每一话的相册目录一样的页面)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/299529

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX