wadewade's recent timeline updates
wadewade

wadewade

V2EX member #646431, joined on 2023-08-31 18:17:16 +08:00
Today's activity rank 1492
wadewade's recent replies
@thedog 这个需要反驳一下,哈哈哈,模型底层就注定了它没办法永远稳定,即使你把温度压到最低,它天然就是进行向量计算预测,如果完全通过模型去预测,可能真的得等到世界模型了,否则现在的模型想要稳定进入企业不太可能。还是需要软件工程去限制它的能力
@newaccount 对的呀,肯定需要在关键的节点卡 HITL ,目前的模型能力还无法完全替代人。所以需要构建一套确定性的 Runtime 体系去控制住模型的幻觉
@leoliu168 是的,企业不会为充满不确定性的产品付费。
@cadl 可以一起探讨一下,我最近就在做这个东西。
@thedog 对呀,就目前阶段来说,模型确实很强,但是幻觉也很严重,还是要靠人去构建系统架构才能真正的进入企业级场景
@409164 是的,这个评估机制确实可以有。这样可以减少模型幻觉带来的盲目自信,不过还是在关键节点,通过 runtime 限制死,核心的动作必须要人工参与授权。企业落地哪怕只有 1%的概率会出现不可控都是很难接受的,不可控带来的就是损失,那产品的信用也就毁了
@JYii 是的,模型虽然强,但是也会发疯,需要控制好它的能力边界。
@shakaraka 任何技术初期都有这样的投机者,但是真正能做到落地的人或者公司,未来都会是一个新的持续增长点
个人觉得挺好用的,因为即使是单人开发,有这么个东西,可以开发过程中形成开发历程文档,后续再做功能扩展的时候就有据可依,不然到最后一定会发现,模型一直在给你打补丁,因为你口述需求的时候只能针对某一个功能点,没有开发文档给脑暴提供依据,最后模型就是在按照你口述的需求进行最短路径实现,到最后代码就变成补丁套补丁的屎山。这是不可避免的,虽然比较浪费 tokens ,但是换来的是系统可维护性的开发历程支撑,后续不管你要做局部功能修改,或者功能重构,都会有据可依,个人觉得这在工程角度来说是值得的。
@Diamond23 可以加我 vx: HiLeooor
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1099 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 22:56 · PVG 06:56 · LAX 15:56 · JFK 18:56
♥ Do have faith in what you're doing.