起因是这些年断断续续在把喜欢的 e 绅士上的漫画下载到本地,(包括前几年 e 绅士也确实有一段时间要关站了),感觉还是下载吧。
然后漫画变得有点多了以后,管理成了问题,因为一般都是种子下载的分成一个个独立文件夹的图片。网站上索引这些图片时是可以按作者搜索,按类别搜索等等的,windows 里本地看的话这些功能是啥也没有的。
然后最近有点闲就撸了个类似于电影软件里刮削器的那种东西,原理就是在没有任何 meta 信息的条件下,通过识图来识别该文件夹下的图片是哪部漫画,然后再把所有 meta 信息给贴上去,印象中是有一些项目做了本地化根据 tag 管理漫画的功能的,也许可以对接。目前这部分还没做,只是单纯做了刮削的部分。
我也不知道有没有什么第三方接口可以识图,我是干脆把全站的所有封面都下载到本地了,大概 50G 左右。
想知道的一件事是,如果把这套东西,连带 e 绅士上爬取的 meta 信息全都上传到 github 的话,emmm 我想还是有人需要的,只不过这是否违反 gh 用户协议?各种意义上
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.