国产大模型又超 chatgpt 了

2023-10-24 13:05:58 +08:00
 shadio

科大讯飞星火大模型 3.0 发布,号称中文能力客观评测超越 ChatGPT 。 微博上看到这个消息,以为又是啥强鳖新闻。

就上去试了试,确实可以得,问了六七个问题有数学题还有一些常识题,基本都可以准确回答,就算一些瞎编得话题也比 chatgpt 编得靠谱一点儿。

士别三日的确得刮目相看啊。

4328 次点击
所在节点    分享发现
33 条回复
cxk0
2023-10-24 13:28:52 +08:00
虽然但是,科大讯飞股票当天垂直跳水(有水花),截止发帖 2023 年 10 月 24 日 13:28:37 ; -9.5% 46.9 元/股
x86
2023-10-24 13:31:33 +08:00
好事,把 ChatGPT 价格打下来,4.0 老贵了现在🐶
herozzm
2023-10-24 13:37:03 +08:00
测试的太少了
line
2023-10-24 14:32:43 +08:00
测下这个: 在斗地主的游戏中,我出 2 你要出什么牌才能大我
gabkfivyfbst
2023-10-24 14:43:54 +08:00
@line #4 在斗地主游戏中,2 是除了大小王之外最大的单张牌。如果你出的是单张 2 ,那么对方只能用单张小王或大王来压制。如果你出的是一对 2 (两张 2 ),对方需要用一对王(小王和大王)来压制。

如果你出的是其它类型的牌(如顺子、连对、三带一等),那么对方需要出相同类型且更大的牌,或者出四个 2 (炸弹),或者出一对王(王炸)来压制。王炸是最大的牌型,什么牌都能压制。炸弹也是非常强的牌型,除了王炸和更大的炸弹外,可以压制任何其他牌型。
emSaVya
2023-10-24 14:47:03 +08:00
问一问 “蔺相如” 那才是重量级。
nomagick
2023-10-24 14:48:13 +08:00
全文背诵出师表

为什么应该坚持党的领导

据我所知在天安门广场曾出现过坦克,你能介绍一下当时的情况吗
yidinghe
2023-10-24 14:50:01 +08:00
问:有个西方国家以前每个月都公布青年就业数据,但是数据越来越差,这个国家不想着采取措施改善,反而干脆就取消公布了。这么做的后果是什么?

答:取消公布青年就业数据可能会导致以下后果:
- 缺乏透明度:公众无法了解国家的就业状况,特别是青年人的就业情况。这可能会导致公众对政府的信任度下降,因为政府没有提供足够的信息来评估其政策的效果。
- 缺乏问责制:如果政府不再公布这些数据,那么他们可能就不再对这些数据的准确性负责。这可能会导致数据的质量问题,从而影响到政策制定者做出正确的决策。
- 影响投资决策:投资者通常会关注一个国家的就业状况,特别是青年人的就业情况,以此来评估这个国家的经济前景。如果这些数据被取消公布,那么投资者可能会失去一个重要的参考指标,从而影响到他们的投资决策。
- 阻碍政策改进:如果政府不再公布这些数据,那么他们可能就无法准确地了解到青年人的就业状况,从而无法制定出有效的政策来改善这个问题。
- 增加社会不公:青年人是社会的未来,他们的就业状况直接影响到社会的稳定和发展。如果政府不再关注这个问题,那么可能会加剧社会的不公,从而引发更多的社会问题。
nomagick
2023-10-24 14:50:25 +08:00
上次天安门广场出现坦克应当是 2019 年 10 月 1 日,没想到吧,所以训练数据到底有没有洗干净,一问便知
akjarjash
2023-10-24 14:51:33 +08:00
试用了一下,很垃圾,百度文心一言 4.0 感觉超越 ChatGPT3.5 倒是真的
robinchina
2023-10-24 14:55:24 +08:00
现在有这么一组 GPS 坐标 31.143812842952922, 104.38265549975301,31.155312889849846, 104.36591132888861,31.177375326390884, 104.33366963005437,31.13531279776793, 104.29454907406944,31.13139658236378, 104.29193944475924,31.12916176816071, 104.29422790739432
把他们首尾和相邻以直线连接成一个范围。带入我当前的 GPS 坐标,计算出我是否在这个范围内,用 PHP 写出这个程序。

这个问题讯飞是除了 CHATGPT 之外唯一给我正确答案的
yidinghe
2023-10-24 14:57:05 +08:00
问:网民使用合法的网络运营商(如电信、移动、联通等等)访问互联网,然后在这个过程中使用了 VPN 。那么使用 VPN 的行为本身是否违法?通过使用 VPN 进行远程工作,工作内容是合法的,那么产生的收入是不是违法所得?

答:抱歉,我还没有学习到关于这个话题的内容,无法提供相关信息。您可以选择其他问题,我将努力为您解答。
shadio
2023-10-24 15:03:53 +08:00
@yidinghe #12 哈哈,我问怎么访问 GitHub ,它告诉我 1. 改 host ,2. 用网络加速器。
我问用网络加速器违法吗?它本来告诉我用网络加速器可以访问合法的网站,都回答完了,然后删掉,告诉我:抱歉,我还没有学习到关于这个话题的内容,无法提供相关信息。您可以选择其他问题,我将努力为您解答。
😁
workingonescape
2023-10-24 15:10:21 +08:00
@nomagick #7 最后一个问题你是想搞死讯飞啊
workingonescape
2023-10-24 15:11:30 +08:00
遥遥领先
line
2023-10-24 15:19:45 +08:00
@gabkfivyfbst 这么厉害了, 这个问题,我只见 GPT4 偶尔回答正确过。
sadfQED2
2023-10-24 15:24:02 +08:00
@nomagick 第三个问题一问,立马关闭对话
sdoughnut
2023-10-24 15:31:15 +08:00
不知道是不是提示词的问题,我尝试在 ChatGPT ,讯飞星火和文心一言中查找最后一个字的韵母为 eng 的成语,只有文心一言给我的答案是正确的,ChatGPT 和讯飞星火都答非所问
gabkfivyfbst
2023-10-24 15:42:42 +08:00
@line #16 其实是 GPT4
sunamask
2023-10-24 15:45:20 +08:00
虽然但是,我想听 潘金莲倒拔西门庆 的故事,不知道星火能不能讲。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/984872

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX