Bard 对于中文问题的回答，真是一塌糊涂

一开始告诉我今天是 2023 年 8 月 2 日，然后它回答里所有相对时间的都是基于——今天是 8 月 2 日。我告诉他今天是 12 月 8 日，那上周 opec+会议的内容是什么，它的回答：“上周的 OPEC+会议于 2023 年 12 月 6 日召开”，但实际是 2023 年 11 月 30 日召开的，内容也是错的一塌糊涂。如果我用英文提问，回答的还挺好。

paopjian

2023-12-08 11:05:50 +08:00

说明语种也会影响 LLM 对话效果

akjarjash

2023-12-08 11:10:23 +08:00

确实，Bard 真的很弱智

KKLeon

2023-12-08 11:16:45 +08:00

@paopjian #1 应该是没有针对中文进行过优化。bing 里的那个 new bing 现在已经集成了 gpt-4 吗？刚才问了同样的问题，回答的更烂.但是也有 new bing 回答的更好的。
就我简单针对几个问题，中英文的提问回答来看，bard 和 GPT-4 （如果 new bing 集成的是 gpt4 的话），各有优劣

KKLeon

2023-12-08 11:18:49 +08:00

@akjarjash #2 也不能都这么说，目前来看，一些需要逻辑推理的问题，Bard 和 gpt-4 都还不能很好的处理，都会出现回答很差劲的情况。

oppaopao

2023-12-08 12:18:24 +08:00

@KKLeon 标题不是中文问题的回答一塌糊涂吗？怎么中英文又各有优劣了！

xiaxiaomao

2023-12-08 12:38:29 +08:00

@KKLeon
Copilot （ New Bing ）虽然说是基于 GPT4 ，但是感觉只是调用了模型，训练数据估计是微软自己搞的，再加上天杀的微软砍（和谐）了好几刀，现在的 Copilot 更像是一个莫的感情的搜索工具，跟 openai 的 GPT4 相比还是差一些

taotaodaddy

2023-12-08 12:55:25 +08:00

需要注意,Copilot 三种模式使用了不同模型
以前是创意和严谨模式用的 GPT4 模型,平衡模式用的 3.5 模型,现在是不是改了不知道
但我昨天试了用严谨模式写代码,水平和 POE 中的老 GPT4 模型接近,这个老 GPT4 模型的编程生产力是高的

还需要注意,目前:
bard 的中文问答,使用的模型不是 gemini,而是旧的模型
bard 的英文问答,使用的模型是 gemini pro,和旧模型能力应该是不同的

KKLeon

2023-12-08 13:00:26 +08:00

@oppaopao #5 对中文问题确实一塌糊涂。英文问题的话，bard 和 bing 都有回答的不好的时候。

KKLeon

2023-12-08 13:02:30 +08:00

@xiaxiaomao #6 原来如此，那么有可以免费体验的纯正的 gpt-4 吗，我想再对比一下。
@taotaodaddy #7 好的，感谢告知。原来还有这一层区别

soft101team

2023-12-10 00:29:48 +08:00

你不是也听傻的

KKLeon

2023-12-10 00:41:24 +08:00

@soft101team 看了你的历史回复，喜提 block ，恭喜你，屎坑里出来的，满嘴喷粪，到处咬人，你再这样下去，狂犬疫苗都不够用了。

soft101team

2023-12-10 00:45:34 +08:00

你自己看你自己的回复，礼貌吗？允许你骂别人，还不允许别人说你两句了，虽然是网上，但是也要文明对吧！

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/998609

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.