有什么办法能量化 AI 超分辨率模型效果吗?例如 waifu2x 有非常多个版本,几年前原版效果很一般,现在感觉几个模型优化的方向都不一样没办法直接对比,测试了很多遍感觉原版效果反而最好

4 天前
 drymonfidelia

另外 Stable Diffuse WebUI 自带那个是不是不支持 alpha 通道,透明的图每次让它超分完都变成黑底

519 次点击
所在节点    程序员
10 条回复
tool2dx
4 天前
以前测试过一次,感觉 swinir 挺好,日常一直在用

/t/975483

效果不太好量化,一般来说模型越大效果越好,swinir 那个模型 100M 左右。B 站和 waifu2x 的模型都太小了。SD 那个属于重新绘图的范畴了,严格意义上不算超分,更像是仿写。
drymonfidelia
4 天前
@tool2dx 我指的是 SD webui 里 Extras 下面的 Upscale ,R-ESRGAN 4x+ Anime6B 这个模型,最近好像挺火,实测效果感觉没有别人说得那么牛逼
drymonfidelia
4 天前
@drymonfidelia 包括 ESRGAN 那个 demo 的效果我也无法复现,实测和 waifu2x 效果很接近,issue 里有同样无法复现 demo 效果的人,作者无回应
tool2dx
4 天前
@drymonfidelia sd webui 里也有 swinir, 就是最下面那个 SwinIR_4x ,在 anima6B 下面。

以前单独测试过 ESRGAN ,模型有过拟合的问题。训练过的二次元图片效果巨好,没训练过的,就和 waifu2x 拉不开明显差距。

中庸之道就是选 swinir 了,不是最好,也不至于垫底。
drymonfidelia
4 天前
@tool2dx swinir 我也测试过,感觉总体来说是原版 waifu2x 才是中庸之道,esugan 第一眼看上去不错但是仔细看涂抹过于严重,圆柱形的物体都让它干成圆锥了
swinir 感觉是没给二次元图片优化过的样子,杂讯比 esugan 很多,但是偏写实的图还原地比 esugan 好很多
waifu2x 没有什么亮点,大部分场合效果比较一般
之前有个 https://waifu2x.booru.pics/ reddit 上的人都说不错,之前我也偶尔用过几次,本来也想测试下,结果上去看在不到一周前就永久关服了
drymonfidelia
4 天前
@drymonfidelia 另外两个模型好像都无法处理透明的 png ,waifu2x 是支持的
drymonfidelia
4 天前
@drymonfidelia 不确定是不是 webui 的问题,没搜索到
Lychee0
3 天前
试试看 [Final2x]( https://github.com/Tohrusky/Final2x) 呢,可以处理 alpha 通道,也支持 swinir esrgan hat dat 等[主流模型]( https://github.com/Tohrusky/Final2x/blob/main/src/renderer/src/utils/ModelOptions.ts)
snylonue
3 天前
ssim 这个指标怎么样
drymonfidelia
2 天前
@Lychee0 试用了,切换模型要点开设置测试起来不够方便,建议加个一键用多个模型超分辨率的功能方便对比效果

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1102317

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX