chatgpt(bing)的中文回答太差了,可以窥知中文网络的谬误和谎言有多夸张了

2023-03-04 22:11:01 +08:00
 lefthand2006

是啊,可为什么我问你“爱一个人不孤单,想一个人才孤单是什么歌的歌词”,你用英文回答我呢

Bing, 9:59 PM 这句歌词出自于《想你的夜》,是由郭富城演唱的一首歌曲 。这首歌曲收录在郭富城 1997 年发行的专辑《我愿意》中,是一首抒情的情歌。

6507 次点击
所在节点    OpenAI
41 条回复
su100
2023-03-05 11:26:26 +08:00
@zpf124 是的,前两天问了一个 kotlin 的问题,让它给个示例代码,结果运行报错,后来发现它的示例是 stackoverflow 上提问者的出错代码
littleBink
2023-03-05 12:15:35 +08:00
@leimao 纯好奇,真的会把 transformer 叫做变形金刚吗
snw
2023-03-05 12:27:28 +08:00
训练用的素材必须用高质量并且做过大量标记的源才行,不然无论中文还是英文都会被内容农场污染。

1145148964
2023-03-05 12:30:58 +08:00
这事真的不怪 chatgpt
YooboH
2023-03-05 12:33:24 +08:00
chatgpt 里面英语训练语料占比超过 90%,而中文语料占比只有 0.1%,900 倍的差距你的论证完全是胡扯
wqzjk393
2023-03-05 12:51:19 +08:00
其实现在的 chatgpt 参数配置感觉更像是一个玩具,以 api 里面 temperature 设置来说感觉在 0.7 0.8 左右,给出的答案看似正确但是有很多漏洞。你可以不断否定他的答案看看他是怎么说的,基本你只要说“你说的不对”,那么他必定会说“你说的对,是我错了”,像这种真的很难拿来作为应用工具,只能做休闲娱乐骗骗不懂行的人
snw
2023-03-05 12:52:51 +08:00
再举个例子,如果你搜可口可乐原浆工厂在哪里,你会发现回答都很肯定地告诉你在“俄亥俄州”,然而这些回答显然都是基于近期某爆款自媒体文章,因为如果把时间限定到旧一些就几乎没有这个答案。

这种错误回答甚至能骗过大部分真人(点赞率很高),你又怎么指望 AI 仅靠搜索去辨别?
(俄亥俄州确实有 syrup plant ,但并不是自媒体所说的全球唯一唯二的原浆厂,可能也不是最大的。更不知道“原浆工厂官网”是什么鬼)



learningman
2023-03-05 15:08:48 +08:00
q:“chatgpt 的中文回答太差了”是否能得出结论“中文网络的谬误和谎言非常夸张”
a:不能仅凭“chatgpt 的中文回答太差了”这一点就得出结论“中文网络的谬误和谎言非常夸张”。尽管 ChatGPT 是一个大型的人工智能语言模型,但其回答的质量受到其所训练的数据集和算法等多种因素的影响。如果 ChatGPT 的中文回答质量差,可能是由于其训练数据集的不足或者模型算法的局限等因素所致,而这些因素与中文网络的谬误和谎言无必然联系。

要评估中文网络上的谬误和谎言的严重程度,需要采用更加科学的方法进行分析和研究,例如基于大数据的分析和调查研究等。只有通过充分的数据和证据,才能得出准确的结论。

有的人的智力水平是真的不如 AI 。
tooroot
2023-03-05 16:21:31 +08:00
让它用英文资料思考就行了
ruxuan1306
2023-03-05 16:41:48 +08:00
@learningman 有些人思维惯性已经深入潜意识了,国外产品对中文支持不好,立马就开始反思。

当年计算机不能输入汉字时,有人就提议废象形汉字,完全拼音化。

> 1980 年权威刊物《语文现代化》丛刊第一期的一篇文章宣称:“方块汉字在电子计算机上遇到的困难,好像一个行将就木的衰老病人。历史将证明,电子计算机是方块汉字的掘墓人,也是汉语拼音文字的助产士。”
AOK123
2023-03-05 20:37:12 +08:00
@leimao 2L
老哥你现实中和人聊 Transformer 也叫它变形金刚吗...
leimao
2023-03-05 22:53:59 +08:00
@AOK123 我说的是真的变形金刚啊,汽车人霸天虎啥的
leimao
2023-03-05 22:55:55 +08:00
@grahamsa0503 现在年轻人看变形金刚已经不叫他变形金刚了吗
LaurelHarmon
2023-03-05 23:20:13 +08:00
纯属放屁。

英文效果为什么好:
首先,原始预训练的语料英文占绝大多数,大力出奇迹,英文自然不会差。
其次,开发过程肯定重点精调英文的效果,因为更通用,熟悉的人更多,所以英文表现更好。
而超大规模模型的涌现能力+人工反馈精调,是 ChatGPT 远超之前模型的关键。

中文这边来说:
没有找到 ChatGPT 用到大量中文的互联网上垃圾语料进行训练的证据(难道中文维基质量差吗?),所以中文互联网恶劣环境污染了 ChatGPT 这个推论不严谨。

就算你抛开训练过程不谈,你能证明法西葡阿这些大语言效果跟英文没有差别,才能得到这个结论。但是估计你也不会这些语言,也没有认真调研过,直接开喷。

你看,你自己的用中文发表的结论都这么草率,经不起推敲,反过来却怪中文互联网环境差。退一步讲,就算真的成立,是不是也有你这种人的一份功劳呢。
alex177027
2023-03-06 01:33:57 +08:00
那你是没见过离谱的英文回答,属于是没见识什么张口就来了
LowBi
2023-03-06 09:14:44 +08:00
一个外国人研发的语言模型,你指望它完美支持中文?凭什么,甚至还锁国区
marcong95
2023-03-06 09:46:54 +08:00
又来定体问了?明显就是 ChatGPT 在不懂装懂而已,或者准确地说就是没有加入自己知识盲区的逻辑。我把我自己原创的五言绝句丢给 ChatGPT 它也说是李白的《行路难》。当年大学毕业脑抽写在毕业纪念册上的原创五言绝句。
6167
2023-03-06 13:14:15 +08:00
这国怎,定体问
littleBink
2023-03-07 01:04:06 +08:00
@leimao 对不起哈哈哈,我也以为你说的是 transformer 框架
anotherside
2023-03-07 14:52:02 +08:00
从这贴可以窥之楼主的思维有多狭隘

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/921185

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX