百度“文心一言”下午 2 点发布会

百度

发布会

言

具体

134 条回复 • 2023-03-17 10:45:27 +08:00

1 2

❮

❯

101

cocong

2023 年 3 月 16 日

乱七八糟的，都不知道哪里可以用，果然是百度。

102

Tina17

2023 年 3 月 16 日

7

有些 geek 夸百度技术牛的，你到底明不明白为什么这些厂商挨骂？！

我就问，是不是不绑定手机号，不实名填上身份证号，就不能注册使用？！

是不是把功能分 8 档 16 类 24 项，每一个单收费，VIP VVIP SVIP SSVIP…………

是不是后台数据直接对接上面，实现“全领域控制”，实现所谓的“精准”“同步”……

什么中文库的大小，这都是小事儿明白么？！

103

tianlianjie

2023 年 3 月 16 日

6

百度所有的产品都是垃圾

104

devswork

2023 年 3 月 16 日

@Tina17 #102 赞赞赞！

105

lookStupiToForce

2023 年 3 月 16 日

2

说个花边，提供点额外信息

"""
......
这座每秒可以完成 400 亿亿次浮点运算，亚洲目前最大的单体智算中心在本月完成升级，将与百度在江苏盐城等地的其他几座智算中心一起，为“文心一言”背后的算力基础设施提供支持。
......
from:
www[.]pingwest[.]com/a/278638
"""

这个 400 亿亿次浮点，我就当它是 FP32 了（单精度浮点）
而去年新出的 4090 ，其官方 FP32 算力是 83 TeraFLOPs ，民间实机测试可能还更高（来源：www[.]4gamers[.]com[.]tw/news/detail/55461/nvidia-geforce-rtx-4090-founders-edition-review ）
1 TeraFLOPs = 1000 GFLOPs = 10^6 MFLOPs = 10^9 KFLOPs = 10^12 FLOPs

所以光这一个超算中心，就用了大概
400 * 10^16 / (83 * 10^12) ≈ 4.8 万张 4090 级别算力的显卡
（如果是禁运的 A100 ，每个 312 teraFLOPS ，则只大概需要 1.1 万张）

而根据公开报道，第一版 chatgpt 也用了 1 万张英伟达 GPU 训练（ www[.]fierceelectronics[.]com/sensors/chatgpt-runs-10k-nvidia-training-gpus-potential-thousands-more ）

也就是说，至少在算力比较上，是不分优劣的。

106

ggyy

2023 年 3 月 16 日

@Tenlp 哈哈，大家都是恨铁不成钢啊！

107

chenPiMeiHaoChi

2023 年 3 月 16 日

先让彦宏出来讲明白魏则西怎么回事再说其他的。

108

mmxq

2023 年 3 月 16 日

2

《文心一言》
文不对题，
心口不一，
一眼难尽，
言不由衷。
百度我日你亲哥，好牌打稀烂的玩意。

109

oamzn

2023 年 3 月 16 日

有邀请码吗

110

namurin

2023 年 3 月 16 日

1

@stnaw 然后事实是党心一言

111

tairan2006

2023 年 3 月 16 日

艹还要邀请码再见

112

privater

2023 年 3 月 16 日

A800 跑出来的模型肯定比 A100 跑出来的 GPT-4 强 8 倍吧 /s

113

vazo

2023 年 3 月 16 日

开源么?

114

vcbal

2023 年 3 月 16 日

@cs1024 确实这论坛恨国党很多，百度 AI 做的确实不错

115

greatbody

2023 年 3 月 16 日

输出视屏的那个就太扯了，一看就是人做的。。。

116

xiaoleis

2023 年 3 月 16 日

已经很久没用百度了。

117

Bigglesworth

2023 年 3 月 16 日

@greatbody #115 那倒不是，文字转视频百家号有

118

Mohanson

2023 年 3 月 16 日

2

看了下发布会, 鉴定为 chatPPT

119

wupher

2023 年 3 月 16 日

我觉得股价说明一切，毕竟出货平仓是要真金白银的。

至少说明市场当前不看好吧。

120

ikenneth

2023 年 3 月 16 日

连实机演示都没有，就放了个视频，逗谁呢。我罗老师还敢理解万岁，yh 这么怂？

121

acthtml

2023 年 3 月 16 日

我倒觉得还行，模型还行，训练的还不够，肯投入还是有机会的。

122

alne

2023 年 3 月 16 日 via Android

@lookStupiToForce 分优劣的是数据，百度的数据肯定不够，质量也欠缺。
中文互联网都是 App 各自为战，靠百度找不到那么多有用的信息

123

xylxAdai

2023 年 3 月 16 日

1

录屏就算了，功能还很垃圾。tnt 至少老罗还现场演示呢。这点自信都没有，建议自己偷偷玩去。

124

yangyaofei

2023 年 3 月 16 日

@cs1024 #33

虽然你说的大致同意, 但是很多东西有点露怯啊, ernie 是 mask language model 和 gpt 这种根本不是一个东西, 前者是 bert 的改进版, 大小什么的也差了 100 倍以上.

paddlepaddle 确实做了很多工作, 但是我们一般是用他的模型但是转成 onnx 用其他运行时跑.

其实百度那个能力, 直接拿别人开源的大模型做微调做成一个还行的东西还是有可能的.

被阴阳的本质是牌子风评太差, 除非能直接超越 gpt4 ,否则做到什么程度都是被喷. 去年年底和今年本来对这个东西很绝望的, 感觉 NLP 不存在了, 妈的被玩死了, 还没能力玩. 现在感觉还好, 方案有了很多, 感觉两三年内, 人手一个 3.5 程度的模型很有可能实现.

125

o00o

2023 年 3 月 16 日

https://www.baidu.com/?%E7%99%BE%E6%AF%92%E5%B7%B2%E7%9E%8E

126

WildCat

2023 年 3 月 16 日

请问这个怎么洗？
我单显卡 PC 都比这个强

魏则西事件不要忘了啊，百度烂到骨子里了。

127

qeqv

2023 年 3 月 16 日

@WildCat 。。。你赔我眼睛

128

jackmod

2023 年 3 月 17 日

可以不质疑百度的「技术」水平。但是给相关技术喂食的「人文」材料呢？

129

n18255447846

2023 年 3 月 17 日

无论怎么说，国内 ai 还得看百度，不然指望 AT 吗

130

ALLROBOT

2023 年 3 月 17 日 via Android

@cs1024 作为拥有十几亿用户的公司，很多方面不太合格

131

sbboy

2023 年 3 月 17 日

@Tina17 实不实名这个估计不是百度能控制的。早年贴吧确实是不注册就能回复的，还有聊天室之类的。

132

acctv2

2023 年 3 月 17 日

@lookStupiToForce #105 其实最大的差距应该还是在数据质量上

百度能拿到的数据质量和 openai 没法比。我记得知乎上也有人提过，GPT3.5 和 4 没有大幅增加参数的原因就是觉得模型参数够了，只是训练数据严重不足。

openai 都觉得缺数据，百度这边只能说接近没数据了

133

Tina17

2023 年 3 月 17 日

@sbboy 我具体什么时候开始玩贴吧记不清楚了，十年绝对有了，或者十年出头

134

Tina17

2023 年 3 月 17 日

@sbboy 零几年的时候玩天涯呢，直到后来没落，12,13 进入知乎，那会儿微博还能凑合看呢，百度知道也可以有用

1 2

❮

❯