1
p7IySTldqB 250 天前
今年 AI 大爆发令人兴奋。
|
2
chipipi 250 天前 “工作中常见到的炮弹问题”
|
3
Satansickle 250 天前
咋?老哥是华为驻非洲工程师?
|
4
paopjian 250 天前
妈耶, 老哥是军工设计师么, 为什么会有弹道预测的问题
|
5
mingtdlb 250 天前
怎么认为他很强?
 |
8
me1onsoda 250 天前
大模型好像都是发布一开始强无敌,然后开始降智了。大模型质量问题,应该要有个监管的机制。
|
9
lthon 250 天前
还在等 Claude 4
|
10
sunny352787 250 天前
哈哈哈哈哈哈这例子要吓死了,其实是做游戏的吧?
|
11
LaTero OP |
12
LaTero OP @mingtdlb 判断字符本来就不是 AI 该做的事,因为原理上 AI 收到的都是 token ,一个 token 可能有好几个字。而且假如真的有了 AGI ,和人类一样的智力水平,你觉得它会浪费算力去数吗?假如是一个聪明的人类,他应该做的是使用工具。AGI 也应该是写一个程序去数,不是自己数。最近 AI 进步也都是在数学、逻辑推理等方面。
|
14
hiveex 249 天前
Poe 用户等上线体验
|
15
pizone 249 天前
不知什么时候能用上 Grok 3 的 api ,还是有点期待。
|
16
CodeAllen 249 天前
没必要问 AI 字符问题,这个跟 NLP 的 token 分词技术有关系,没什么意义。
这就有点像一个人口头问你,计算“饕餮盛宴”这几个字有几个笔画,能当面正确写下这四个字的人都不多吧,还得数笔画,有什么意义? |
17
sunny352787 249 天前
@LaTero 哎,同行的敏锐性~
|
18
stone9527 249 天前
|
19
LaTero OP @stone9527 没问题呀,现在主流的模型这个都不会错的吧。我平时主用 openrouter ,这个网站的 chatroom ,预设的几个问题就有 9.9 和 9.11 哪个大,还有 strawberry 里几个 r 。后者还有些模型会错,但是前者这样比大小的基本都是没问题的。
|
20
pkoukk 249 天前
强是很强..
但是老🐴用了快 10 万张 h100 ,居然只获得了 1400 分出头,仅仅比 R1 强 40 多分,3%左右 而且这么大的训练规模,预计参数量也不小,推理消耗估计也挺大 有点不及预期了 |
21
br00k 249 天前
试了下,感觉没有多少差距。不及预期。
|
23
yukino 249 天前 via Android
要不你跟隔壁 openai 楼的老哥打一架
|
24
kaedea 249 天前 via Android
做一下今年考公的行测题试试
|
25
Ehend 249 天前
编程领域感觉不如 chatgpt 和 deepseek
|
26
gitxuzan 248 天前
编程方面不行,比 gpt 差
|
27
gitxuzan 248 天前
deepseek 如果有这么强的算力,不是要排行老大了。
|