Groq 的速度真的好快啊

244 天前
 coinbase

这是什么原理

4105 次点击
所在节点    分享发现
29 条回复
BIND
244 天前
确实快,感觉这个 AI 它上辈子是个哑巴,这辈子急着说话。我问题刚问完,它就库喳一下子答完了。
a1b2c3T
244 天前
刚去试了一下,确实好快啊,不像 gpt 一个字一个字往外蹦…蹲一个大佬解释一下
waynevan
244 天前
用的自研芯片,不是英伟达的
xiaohundun
244 天前
你不看看他用的什么模型,lama3-8b
cat9life
244 天前
@xiaohundun #4 所以算力要求很低?
xiaohundun
244 天前
@cat9life 8b 很低,不过我看他可以切换模型 70b ,也挺快的,这要看他的使用量,像是 ChatGPT 、Claude.ai 使用量大,慢一点不奇怪,当然也可能是他的 LPU 引擎很牛
tianzi123
244 天前
我去,速度太快了,有点不适应了
yianing
244 天前
@xiaohundun #4 8b 是 800t/s ,70b 是 280b/s ,都挺离谱的
idragonet
244 天前
测试下还是快,不过正式库很老。
ThinkStu
244 天前
感觉速度挺快,质量不如 GPT3.5...
492
244 天前
准确率怎么样,我随手测了下速度确实快
rambo92
244 天前
确实快,不过还是没有解决 鲁迅为什么殴打周树人 的问题 哈哈哈
youmilk
244 天前
@rambo92 模型换 70b
securityCoding
244 天前
llama3 8b 模型我在 8G 显存开发机上跑,速度快到起飞
WashFreshFresh
244 天前
为啥 web 登录上去不能发消息...
aduangduang
244 天前
快是真快,傻也是真傻
pkoukk
244 天前
你别问我对不对,我就问你快不快吧
lichuyi
244 天前
@rambo92
鲁迅为什么殴打周树人
鲁迅( 1881-1936 )和周树人( 1885-1957 )是中国现代文学家和作家,两人都是中国文学界的知名人物。关于鲁迅殴打周树人,实际上是鲁迅在 1927 年的一篇文章《周树人》中提到的事件。

根据鲁迅的描述,1925 年,他和周树人在上海的一家咖啡馆中遇见,周树人在喝咖啡时,鲁迅认为他喝的咖啡太多,鲁迅便殴打周树人。鲁迅在文章中解释说,他殴打周树人是因为周树人喝的咖啡太多,鲁迅认为这是对中国文化的污染。

然而,这个事件的真实性和鲁迅的描述是否准确,仍然是一个争议的问题。一些学者认为,这个事件可能是鲁迅的虚构或夸大,旨在攻击周树人和中国文化。周树人本人也没有留下关于这个事件的记载。

总之,鲁迅殴打周树人事件的真实性和原因仍然是一个争议的问题,需要更多的证据和研究来确定事件的真实性。
ZekeChin
244 天前
https://www.reddit.com/r/LocalLLaMA/comments/1auxm3q/groq_is_lightning_fast/
有个自称 Groq Engineer 的哥们在解释可以看看
ZekeChin
244 天前
@rambo92 准不准是模型的问题啊,Groq 单单只负责推理。
当然他有没有对模型做量化是不知道的,如果做的那确实会影响部分结果

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1034466

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX