一个可自定义规则爬取绅士漫画站点的应用可有实用性

2016-08-16 04:43:44 +08:00
 PureDark

10 天前突然不知道哪来的兴趣开始研究怎样更便捷地浏览各大绅士站点,大名鼎鼎的 E 绅士自然是首要考虑对象,虽然我知道已有 ehviewer 这样大名鼎鼎的先辈,但是我发现它仍然有局限性,不支持多个站点

于是手痒花了 10 天大概把应用做了出来,主要功能是,本身不带有任何和谐内容,甚至我觉得都可以发 google play ,一切爬站点的规则都可以手填、粘贴 json 、或者通过扫描二维码的方式添加 规则的写法相当简单,稍微解释一下,任何一个有点 html 基础知识的人都能写出来吧,并且可以分享给其他人用

搜索只做了可以适配所有网站的基础搜索,自动补全是从获取的到 item 的 tag 收集

github 主页: https://github.com/PureDark/H-Viewer

目前还差下载功能,下载大概就是做成逐图片保存,这样不会有配额之类的风险,而且也可以适配所有网站 目前测试写的三个站, lofi.e 绅士, g.e 绅士、 wnacg ,目测 nhentai 也很容易写规则,我还是留给有兴趣的人写吧……

Preview

18149 次点击
所在节点    问与答
29 条回复
wjm2038
2016-08-16 23:25:17 +08:00
@PureDark 真正的绅士...
Sunyanzi
2016-08-17 00:31:43 +08:00
这个能抓里绅士那样需要登录的站吗 ..?
PureDark
2016-08-17 03:54:42 +08:00
@Sunyanzi 不做内置登录,但是填写规则的页面有一个填入 cookie 的输入框,输入了的话会在请求时带上 Cookie ,但是这就要求你自己用电脑登录里 E ,然后 F12 看自己的 PHPSESSID 了……
x8888k
2016-08-17 13:34:32 +08:00
妈妈再也不用担心我的右键了
crazyred
2016-08-17 15:09:45 +08:00
然而太复杂了,简单易用才是王道啊
PureDark
2016-08-18 03:48:01 +08:00
@crazyred 对于使用者来说并不复杂,只需要扫一下二维码就可以添加一个新站点,除此之外使用就只是点一点的事情了

另外下载功能写完了,会在近期放出下载(等我把 License 、检查更新、关于里的内容填好、)

![]( https://github.com/PureDark/H-Viewer/raw/master/images/9.png)
PureDark
2016-08-19 15:53:59 +08:00
已经做完初版了,测试无误
一晚上更新一个小版本号把发现的 BUG 也修复了
大家试用一下吧,有 BUG 欢迎在 issues 里反馈

https://github.com/PureDark/H-Viewer/releases

目前做的还是基础功能,后续有什么功能 Request 也在 issues 里提吧
前提是这个功能是要能适用于大部分网站的,一些比如 E-hentai 独有的高级搜索之类的就不做了,因为没法兼容其它站
lbq
2016-08-20 12:53:39 +08:00
建议增加对图片列表页直接能得到大图地址的支持,现在我好像只能通过 urlecho 之类的服务凭空制造一个页面……(

http://paste.ee/r/fdp1u (跑
PureDark
2016-08-20 13:15:38 +08:00
@lbq 没想到这么快,在我还没写页面解释规则格式的情况下就已经有第三方出来了 2333


我没考虑的情况其实挺多的,一开始是按照 lofi.e-hentai 来定 Rule 的数据结构的,然后适配 g.e-hentai 和 wnacg 时遇到问题又拓展了,虽然我写 nhentai 时已经不用再修改就能适配了,不过毕竟这四个站点还不能代表所有站点的结构,还是会遇到特殊情况的,建议在 issues 里提一条加个 request 标签、免得我之后忘记了、

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/299529

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX