Bard 对于中文问题的回答,真是一塌糊涂

2023-12-08 11:04:31 +08:00
 KKLeon

一开始告诉我今天是 2023 年 8 月 2 日,然后它回答里所有相对时间的都是基于——今天是 8 月 2 日。我告诉他今天是 12 月 8 日,那上周 opec+会议的内容是什么,它的回答:“上周的 OPEC+会议于 2023 年 12 月 6 日召开”,但实际是 2023 年 11 月 30 日召开的,内容也是错的一塌糊涂。 如果我用英文提问,回答的还挺好。

1521 次点击
所在节点    OpenAI
12 条回复
paopjian
2023-12-08 11:05:50 +08:00
说明语种也会影响 LLM 对话效果
akjarjash
2023-12-08 11:10:23 +08:00
确实,Bard 真的很弱智
KKLeon
2023-12-08 11:16:45 +08:00
@paopjian #1 应该是没有针对中文进行过优化。bing 里的那个 new bing 现在已经集成了 gpt-4 吗?刚才问了同样的问题,回答的更烂.但是也有 new bing 回答的更好的。
就我简单针对几个问题,中英文的提问回答来看,bard 和 GPT-4 (如果 new bing 集成的是 gpt4 的话),各有优劣
KKLeon
2023-12-08 11:18:49 +08:00
@akjarjash #2 也不能都这么说,目前来看,一些需要逻辑推理的问题,Bard 和 gpt-4 都还不能很好的处理,都会出现回答很差劲的情况。
oppaopao
2023-12-08 12:18:24 +08:00
@KKLeon 标题不是中文问题的回答一塌糊涂吗?怎么中英文又各有优劣了!
xiaxiaomao
2023-12-08 12:38:29 +08:00
@KKLeon
Copilot ( New Bing )虽然说是基于 GPT4 ,但是感觉只是调用了模型,训练数据估计是微软自己搞的,再加上天杀的微软砍(和谐)了好几刀,现在的 Copilot 更像是一个莫的感情的搜索工具,跟 openai 的 GPT4 相比还是差一些
taotaodaddy
2023-12-08 12:55:25 +08:00
需要注意,Copilot 三种模式使用了不同模型
以前是创意和严谨模式用的 GPT4 模型,平衡模式用的 3.5 模型,现在是不是改了不知道
但我昨天试了用严谨模式写代码,水平和 POE 中的老 GPT4 模型接近,这个老 GPT4 模型的编程生产力是高的

还需要注意,目前:
bard 的中文问答,使用的模型不是 gemini,而是旧的模型
bard 的英文问答,使用的模型是 gemini pro,和旧模型能力应该是不同的
KKLeon
2023-12-08 13:00:26 +08:00
@oppaopao #5 对中文问题确实一塌糊涂。英文问题的话,bard 和 bing 都有回答的不好的时候。
KKLeon
2023-12-08 13:02:30 +08:00
@xiaxiaomao #6 原来如此,那么有可以免费体验的纯正的 gpt-4 吗,我想再对比一下。
@taotaodaddy #7 好的,感谢告知。原来还有这一层区别
soft101team
2023-12-10 00:29:48 +08:00
你不是也听傻的
KKLeon
2023-12-10 00:41:24 +08:00
@soft101team 看了你的历史回复,喜提 block ,恭喜你,屎坑里出来的,满嘴喷粪,到处咬人,你再这样下去,狂犬疫苗都不够用了。
soft101team
2023-12-10 00:45:34 +08:00
你自己看你自己的回复,礼貌吗?允许你骂别人,还不允许别人说你两句了,虽然是网上,但是也要文明对吧 !

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/998609

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX