为什么 ai 生成的图片 手指总会有问题

104 天前
 dai269619118
用 midjourney 生成图片的时候

人物的手指的数量 4 5 6 个都会有

出现问题的概率还挺大的

为什么手指的数量上还处理不好?

整体图片生成的都还挺好的,手指上总有瑕疵

用的是 6.1 的模型

有做着相关的大佬来说说吗 具体是怎么样的一个难点。
2899 次点击
所在节点    程序员
13 条回复
rekulas
104 天前
这个网上不是很多分析了么,根本原因就是 ai 在缺乏对基础知识(投影、形体、物理、空间关系、力学等)的真正理解,而手虽然看起来简单,实际是一个比较复杂的结构,不同手势、角度带来的变化太大了,以目前 ai 的训练量还很难较为完美绘制

mj 在手部上不算特别出色,现在有一些针对手部的增强模型,可以 mj 画了主图之后用增强模型修复手部,可以上 civitai 搜搜

另外我觉得这也只是暂时的,大力出奇迹,ai 还在不断迭代,只要训练数据够多别说手千手观音都 so easy
dai269619118
104 天前
@rekulas 兄弟我知道手势很难 我上面的问题是 手指生成数量的问题
coderluan
104 天前
试试最新的 Flux ,参数多了效果就好很多了,手这块比 midjourney 强很多。
rekulas
104 天前
一样的道理啊,因为手势的复杂性,喂给 ai 的图可能只有 3 根手指 可能 5 根,就像你训练 ai 看了 1 亿颗树,它肯定能画出让你满意的树,但绝对没法稳定画出树叶数量刚好==平均树叶数量的树
你问的是原因,你若要问解决方案,没什么好的办法,只有尝试下新的模型,sd3 和手部增强版
cmdOptionKana
104 天前
flux 在这方面有明显改善,偶尔画错,但正确率已经很高,已经不能说 AI 画不好手了。
kaneg
104 天前
其实画过画的应该知道,画手是比较难的
freshgoose
104 天前
flux 在这方面的改善还是很大的,这里有个免费版可以测试一下 https://fluxai.dev/zh/playground
linch97
104 天前
AI 学的是统计规律,并没有逻辑。而且每个特征分辨率越低,越容易出错,你画几张手占主体的就会发现出错概率低了。加上手本来结构就很复杂,经常还有遮挡关系,都是目前 AI 绘图原理无法解决的。
flankechen
104 天前
1.人画画,手也是最难画的之一。
2.现在的 ai 画画本质上都是扩散模型从纯噪声一步步去噪而已,物理,结构,投影一毛线关系没有,细致的结构,提示词对齐,一致性还有很多可以进步的。
3.LS 说了,统计规律而已,目前数据细致程度和参数量没能到那个量级。不过一开始的时候,脚的数量有时候都会不对啊,现在的 fulx 好多了。
pkoukk
104 天前
我猜,是大家给图片打标签喂给 AI 的时候,并没有标注这图上有几根手指吧...
所以 AI 也并不清楚,这时候应该有几根
sentinelK
104 天前
因为画图 AI 的实现逻辑,是从一个低分辨率图,利用统计学原理作为概率基础,逐步细化去噪的过程。

因为是统计学原理,所以 AI 对于什么是“手”,以及“手”的物理概念一无所知。他只是知道绝大多数的画,在这个地方,会画成这样而已。

手部在绘画中占用的资源(像素点)并不多,同时手部因为灵活,所以遮挡、姿势多样。相对脸部,躯干而言,属于信息量小,但变化大的部位。这也就导致其统计学“局部最优解”比较多,而且没有明显的全局最优。

这就会导致手部的绘画容易出现错误。
cocomanber
103 天前
这个手的数量的确是个问题哈哈哈,mj 都出现过鸡爪。。。离谱
leegradyllljjjj
103 天前
真以为是外星智能啦,ai 后台跑的都是统计学模型,现阶段所有 ai 模型都是基于概率论的,现在的大模型是语言模型,加减乘除都能算错

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1070664

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX