[开源]ACG2Vec——ACG 相关深度学习应用(以图搜图、插画评分、文本搜图等)

2023-07-25 19:41:44 +08:00
 OysterQAQ

ACG2vec全称为Anime Comics Games to vector 。本 repo 会持续维护一些基于二次元相关的深度学习领域实践与探索。

在线预览(目前包含文本搜索、以图搜图、文本搜图、图片分数预测):https://cheerfun.dev/acg2vec/

开源仓库:https://github.com/OysterQAQ/ACG2vec

演示页前端开源仓库:https://github.com/wewewe131/acg2vec-frontend

以上两个仓库求个 star QAQ🌟🌟🌟

目前模块包括:

💡预览

语义文本搜索

语义图像搜索

插画综合评分预测

以图搜图

6897 次点击
所在节点    分享创造
42 条回复
zoharSoul
2023-07-25 20:46:24 +08:00
大佬 nb!!!
OysterQAQ
2023-07-25 20:53:27 +08:00
@zoharSoul 还是比较浅层的一些实践,当作研一一年学习的总结😁
tanranran
2023-07-26 12:53:27 +08:00
研一就这么强了,大佬牛批
OysterQAQ
2023-07-26 13:11:35 +08:00
@tanranran 研一要结束了,还有一些实践在论文中,还没发出去所以没办法开源
tanranran
2023-07-26 13:21:54 +08:00
@OysterQAQ #4 大佬太适合读博了,继续深造下去吧
OysterQAQ
2023-07-26 13:26:08 +08:00
@tanranran 不考虑读博了,现在深度学习应用科研消耗不是一般人能承受的了,而且更喜欢工业界的一些东西(实用,有意义),学术界上缝合的太多了(包括我自己)。而且硕士运气好老师挺不错的,也见到很多其他的老师,读博还得再 roll 一次🐶
Aloento
2023-07-26 16:18:47 +08:00
太强了,愿意贡献一张 A100 给大佬助助兴
OysterQAQ
2023-07-26 16:32:37 +08:00
@Aloento 感谢大佬,不过目前没啥需求了,也没想到什么合适的新项目。以上项目主要是数据集都很大 需要本地存储,我自己组的 3080+3090 ,本地机械 80t ,有很大一部分都被数据集占了(特别是为了训练时候不预处理,提前存储好二进制的已经预处理好的数据集文件)
LancerComet
2023-07-26 18:47:08 +08:00
acgvoc2vec 有点意思,我给自己做了一套收图的图库跑在了群晖上,图片有 tag 和 tag 同义词,不过同义词都是手动关联的,acgvoc2vec 可以做到自动化;另外 dclip 是不是也可以反着来,通过图片生成 tag
OysterQAQ
2023-07-26 18:52:37 +08:00
@LancerComet dclip 通过图片生成 tag 可以用向量检索方式实现,不过类似 BLIP 这种生成式可能更好一些
xiaoxiao168
2023-07-27 10:24:40 +08:00
@OysterQAQ 有考虑像 生成 模特儿吗? 有些公司在搞了, 更新不同产品 ,目标消费者 生成不同的模特,这个算“工业界”吗? 不是很懂,
(有兴趣做(跨境)电商的朋友 欢迎交流
https://discord.gg/VjWJbTjNWQ
跨境电商 合作共赢)
maocat
2023-07-27 10:39:38 +08:00
#11 @Livid 速 ban
DeltaSix
2023-07-27 15:07:21 +08:00
@OysterQAQ 谢谢,我需要研究研究,我的水平也就是简单调用一下 Resnet 跑跑识别什么的😢
LancerComet
2023-07-27 17:58:37 +08:00
@OysterQAQ

简单试了一下 acgvoc2vec 还行,给自己的小图库晒同义词合并是够了,随便试了一下:

The similarity between '赤井心' and '赤井はあと' is 0.7822584509849548
The similarity between '虚拟主播' and 'VTB' is 0.5672250986099243
The similarity between '虚拟主播' and 'VTuber' is 0.5994329452514648
The similarity between 'VTuber' and 'VTB' is 0.7549457550048828
The similarity between 'JK' and '高中女生' is 0.6553347706794739
The similarity between 'Maid' and '女仆' is 0.7300522327423096

不过还没想好怎么集成,目前只想到做成选择某个标签的时候将评分高的同义词都列出来然后自己筛选,平时只需要往里填同义词之后再筛选就可以,感谢楼主开源

PS:果然最宝贵的还是数据,只看到一条数据库 connect string
OysterQAQ
2023-07-27 18:03:02 +08:00
@LancerComet 统计科学是这样的,数据是基础😬
wentx
2023-07-28 10:55:31 +08:00
啥时候可以以图搜片?
OysterQAQ
2023-07-28 10:59:31 +08:00
@wentx 有数据集就可以做
charslee013
2023-07-28 18:05:33 +08:00
赞美大佬开源~

有个问题想请教一下,我自己搭建试了一下,发现 web-app 里面没有 `/similarityImages` 路由
这是要自己搭建一个向量库存储全部图片的特征,然后根据上传图片的特征值(阈值为 0.5)来做匹配么 🤨
OysterQAQ
2023-07-28 18:07:42 +08:00
@charslee013 yes 本来有打算集成,但是太臃肿了,自己搭建更加自由一些。
OysterQAQ
2023-07-28 18:09:52 +08:00
@charslee013 额 看错了 相似度搜索没有阈值的说法,是直接搜出 topk 相似的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/959669

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX