如何检测一段文本是否是 ChatGPT 等 AI 生成的?

2022-12-06 10:01:15 +08:00
 meetalpha

必要性

  1. AI 可以瞬间生成答案,答案又可以大量复制粘贴,挤占了论坛的回答位置。
  2. AI 很多是胡说八道,但是一本正经的回答,容易让人产生是正确答案的错觉。

思路

人能看出来这些区别很容易,但是按照现有的技术,机器能不能检测?

9413 次点击
所在节点    OpenAI
64 条回复
MiketsuSmasher
2022-12-06 12:52:51 +08:00
根据我昨天晚上玩出来的经验,给你要问的问题里面埋几个坑,如果是真人回答问题的话,是不会踩进去的。而 ChatGPT 会踩进去,或者拙裂地忽略掉。

比如说 ChatGPT 对“意大利面拌 42 号混凝土怎么做好吃?”的回答,可以看到它明显没有避开大坑:

意大利面拌 42 号混凝土可以搭配不同的酱汁来做,比如番茄酱、芝士酱、蛤蜊酱等,还可以加入蔬菜、肉类、蘑菇等来搭配,可以根据自己的口味来调整,做出美味可口的意大利面拌 42 号混凝土。
MiketsuSmasher
2022-12-06 12:56:04 +08:00
再比如说,如果 ChatGPT 对问题里模糊不清的地方猜得不对,就会:

Q:世界杯买德国还是买日本
A:这取决于你的偏好。如果你喜欢德国的风格,那么买德国的球衣可能更好;如果你喜欢日本的风格,那么买日本的球衣可能更好。

显然,提问者要问的不是买哪国的球衣。
ShinichiYao
2022-12-06 12:59:34 +08:00
当 AI 知道要故意犯点错的时候人类就真完了
pennai
2022-12-06 13:02:23 +08:00
楼里的辨识方法,经过训练 AI 也同样会具有这些特征。。。
WinkeyLin
2022-12-06 13:04:57 +08:00
三段式结构,很好认
Jenny12
2022-12-06 13:06:13 +08:00
用魔法打败魔法
yolee599
2022-12-06 13:09:37 +08:00
@yiikZero 我看这个回复好像 AI 回复
d3vil
2022-12-06 13:10:35 +08:00
楼里说的这些特征,AI 都可以进行学习改善,能不能说点学习不了的?
bravecarrot
2022-12-06 13:17:56 +08:00
生成对抗学习啊
很早就有人研究了
Cabana
2022-12-06 13:39:16 +08:00
@MiketsuSmasher #21 现在再问这个问题,他已经会回复说这是一道虚构的菜肴了 😧
cosette
2022-12-06 13:41:28 +08:00
为了让生成的文本看起来有意义,目前 chatGPT 采用了非常正式的行文风格。但总的来说,AI 的好与坏还是在于是否表达出了特定的意义,因为 AI 不具备人的需求和欲望,所以只有两种结果,一种是 AI 通过学习互联网上的文本,找到可能的匹配文本,让对话看起来好像是有意义的(说得通的),第二种就是 AI 基于语言学模型纯粹的脑补,胡说八道。

从行文格式上来讲,基于语法句法的东西 AI 最终都可以学会,包括互联网语言的一些使用习惯,甚至可以表现出某种“道德倾向”、“政治倾向”,因为这些本身就是基于符号的,再者就是基于语段和语篇的分析,也可以把一些套话、常识学习的很好,变成一个非常“聪明”的鹦鹉,总而言之,任何基于“符号”的甄别方法对不断进步的 AI 来说,最终都是很难奏效的。
milukun
2022-12-06 14:00:35 +08:00
@swulling 哈哈哈 但是你还是忘了开通重复问题。「要检测一段文本是否是 AI 生成的」,AI 味太浓了。
weixiangzhe
2022-12-06 14:10:59 +08:00
这贴子里就有好多 AI,我都魔振了
mlhadoop
2022-12-06 14:47:25 +08:00
如果答案正确,是不是 ai 回答的这个问题 还值得探讨吗? 毕竟找到答案就好了?
ershierdu
2022-12-06 14:59:16 +08:00
@mlhadoop #34

StackOverflow 的 ban 掉 chatgpt 的原因:The primary problem is that while the answers which ChatGPT produces have a high rate of being incorrect, they typically look like they might be good and the answers are very easy to produce. There are also many people trying out ChatGPT to create answers, without the expertise or willingness to verify that the answer is correct prior to posting.

https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
lusfold
2022-12-06 15:04:02 +08:00
对于判断一段文本是否是 AI 生成的,一个常用的方法是人工阅读该文本并根据其内容、语言使用情况、语言流畅程度、内容的逻辑性等因素进行判断。如果文本内容较为简单、语言使用不够自然、内容缺乏逻辑性,那么这段文本很可能是 AI 生成的。

如果您想进一步确定一段文本是否是 AI 生成的,您可以尝试使用一些 AI 文本检测工具,这些工具通常会使用一些算法来分析文本内容和语言使用情况,并给出一个可信度分数,指示这段文本是否可能是 AI 生成的。这些工具并不能百分之百地准确判断一段文本是否是 AI 生成的,但是它们可以作为一种参考,帮助您更准确地判断文本的真实性。
douniwan5788
2022-12-06 15:26:35 +08:00
检测是否是 AI 生成的其实是本末倒置,真正应该检测的是大量胡说八道的垃圾回复,单纯检测 AI 只是取巧的方式,而且会越来越难了
yiikZero
2022-12-06 15:46:35 +08:00
@yolee599
@swulling
是的。
CL007
2022-12-06 16:12:51 +08:00
用 AI 对抗 AI ,成了生成式对抗网络 gan ,最终 AI 的输出越来越像人类
izzy27
2022-12-06 16:18:34 +08:00
好问题,CV 里面有检测图片是否有 AI 生成的研究方向吗? 如果有的话,这感觉也是一个研究方向

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/900403

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX