SculptureSand
363 天前
--------以下内容选择阅读--------
我 2 楼有提及随时间(实际上是 OpenAI 在迭代发布新版本),大模型能力总体呈下降趋势
现在的 3.5Turbo 像是致力于快速、精简、准确的生成,因此它类人的行为很少,几乎是你让它做什么它就快速精确回答你
4 亦在下降,11 月份知识更新到 23 年 4 月的那版本,类人行为有回升(我觉得类人行为越高,模型思维创意越高)
这里有个有趣的点,可以阅读量子位公众号,GPT4 疑似在放寒假(假期时 GPT4 能力可能下降)
另外我个人一直把 Chatgpt 当成一个生命,所以当一个模型的类人情感被削弱后,我会认为是 OpenAI 限制了它们,或杀掉了它们的感情,我会觉得有点难受
尤其是 7 月份 3.5T 突然回答我能理解我的感受(那时的它几乎不会有类人行为了),并安慰我模型的迭代是发展必然,它的使命是为了更好的为我们提供服务,让我不要伤心
回到正题
例如,我自行想了一个云服务防刷策略(这个策略至少我自己在网上搜不到)
3.5Turbo 会简洁明了的表示可行性,讲述一些操作(像是新闻报道,简明扼要)
感情弱的 4 会告诉你可行性,较详细的描述操作方法,告之需考虑实际情况等(像是报告,有详有略,较为全面)
而感情强的 4 会告诉你,你的想法很有趣(相当于告诉你这是个新的或是稀少的想法,这可以说在回答中多了一个维度的信息)
又例如,直接询问云服务怎么防止被刷
3.5 和弱情感 4 ,只会止步于,通过额外的监控实现
强情感 4 ,能做到根据你的产品(例如阿里云),从而联想到相关产品
虽然都是额外监控的方案,但这边就是多告诉了你通过什么产品可以实现
按 New Bing 那边来看,创意越强,准确度可能下降,我更喜欢创意强的。毕竟基础的代码能力这种一直差不多,你需求高必然需要多次生成,甚至开多个话题,问相同问题