V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  lonelygo  ›  全部回复第 1 页 / 共 72 页
回复总数  1436
1  2  3  4  5  6  7  8  9  10 ... 72  
你应该找的是 YOLO
91 天前
回复了 twinsant 创建的主题 Python 中年高龄开始学习 Deep Learning
@Jinnrry 现在 LLMs 这么火,模型架构基本都手链到 transformer 的自回归部分也就是 decoder 部分。
而,HF ( huggingface )开源的 transformer 库基本就是所有开源 LLMs 使用的标准 transformer 实现( Google 除外,坚守自家框架,但也不是 TensorFlow 了,而是用 JAX )。
又,HF 的 transformer 使用 PyTorch 实现的,所以,过去几年 TF 就逐渐江河日下了,所有新工作,新 paper ,新开源基本都是在 pytorch 下了。
所以,这时候入坑,就当没有 tf 这个框架,也不亏。
93 天前
回复了 twinsant 创建的主题 Python 中年高龄开始学习 Deep Learning
@twinsant 22 楼 @ladeo 正解,tensorflow 别用了,被时代抛弃的框架了,直接上手 pytorch2.x 吧。
264 天前
回复了 lonelygo 创建的主题 程序员 40 岁依然可以奋力前行
@HOYU 额。。。这是为啥
304 天前
回复了 main1234 创建的主题 程序员 [求问] 没学历没基础咋入门 AI 啊
@mantouboji 经验害人啊,这是我写的。
304 天前
回复了 main1234 创建的主题 程序员 [求问] 没学历没基础咋入门 AI 啊
2023-09-13 10:09:03 +08:00
回复了 Daotin 创建的主题 程序员 安卓 or 苹果?想听听 V 友们的看法
@guozi1117 不知道,还在等大神出方案了。
@guozi1117 我是手贱从桥接改成光猫拨号,看测速到底能不能跑满。现在好了,测速肯定能跑满了。。。。。
哎,刚登上去,重启一下,登不上去了。。。。
2023-07-21 15:56:06 +08:00
回复了 rabt 创建的主题 程序员 听说 ml 域名被收回了?你们的还能用吗
我说昨天开始我的 openai 的 API 怎么抽风了😭,怎么也想不到是 ml 的反代跪了
2023-03-13 10:33:24 +08:00
回复了 afit 创建的主题 分享创造 基于 gpt-3.5-turbo 模型,搭建了 light-gpt,欢迎体验
已🌟
2022-11-29 10:20:58 +08:00
回复了 terrysnake 创建的主题 Android 对新出的 VIVO X90 PRO+很心动,求打醒~
@terrysnake 这段时间不是每天都有裁员的各种消息么,今天不知道明天啊。
2022-11-25 10:17:34 +08:00
回复了 terrysnake 创建的主题 Android 对新出的 VIVO X90 PRO+很心动,求打醒~
你就不怕明天毕业么🔔


这样打可以咩😁
2022-11-22 10:36:49 +08:00
回复了 lsww 创建的主题 NVIDIA AI 卡的工作原理
@lsww 训练推理分开说。
先说推理。目前大模型是有,但是不多,模型也没大到一定要上多机的。毕竟现在 20G 、40G 显存的 GPU 还是有的,模型再大,整个单机多卡足矣。而且这种推理侧的模型拆分,其实就是简单粗暴,把模型切成几片,保证每个分片的 weight 能塞到 AI 卡的 DDR 上去就行,然后多卡组个流水线完事。
再说训练。这玩意就能说几天几夜了。
不管单机多卡还是多机多卡,首先要知道的:
并行计算相关的概念和知识;
然后并行训练的三个名词:数据并行,模型并行,混合并行;
多机的情况下,应为有跨机器通讯甚至是跨机柜通讯,靠网卡那是万万不行的,又要去了解:
各种大规模并行算法的拓扑设计(其实顺手也就了解了物理服务器的拓扑设计),这个有不少经典 paper 可以看;
高性能通讯,那就绕不开 RoCE 和 IB 了,又是知识点;
这些搞明白了,下面就要琢磨下各框架怎么做分布式并行训练的:
前人怎么改造 TF 和 PyTorch 的;
怎么把 TF 、PyTorch 当后端,在上面怼个分布式的轮子(框架)来实现分布式的;
OneFlow 怎么平地起高楼,从头撸一个分布式并行训练优先的框架,怎么保证不改代码单卡、多卡、多机多卡都能玩起来;

基本概念都有了,那么就可以琢磨琢磨哪里有优化点可性能瓶颈了,可以造轮子了。
2022-11-20 11:30:08 +08:00
回复了 lsww 创建的主题 NVIDIA AI 卡的工作原理
@lsww 题主不知入行多久,目前在做什么事情,直接点说,这个问题问的并不清楚:
首先:AI 卡可以理解为异构的 AI 计算加速卡。
如果是:`从操作系统角度理解其工作原理`,那么是不是在问:
`异构计算加速平台的计算调度在 OS 层面做哪些工作?`,那对用户来说其实就是:PCIe ,DMA 这些数据搬运相关的事情,其他的比如中断这些,都是厂商软件栈的事情了。
如果是:`AI 加速卡的工作原理`,那么是不是在问:
`AI 加速卡如何做到高效的并行计算,来提高计算效率的?`,那就从怎么做 GEMM 加速,并行计算,这些看起,#2 @kakalala 提的 opencl 是理解并行计算的一个路径,还可以去看看 cuda 的文档,从硬件架构到 SIMT 到 Warp 都有图文并茂的解释。
另外,从技术角度,AI 训练和 AI 推理,看起来差不多,但是从操作系统来看,两者之间的软件差异其实非常大:
推理简单,把主机代码和设备代码确定了,workload 丢给 AI 卡,等回调,主机代码继续干后处理完事。
训练复杂,单机多卡,多机多卡集群,涉及到分布式计算,通讯,模型并行 /数据并行 /混合并行,等一大堆东西。
2022-04-23 10:13:01 +08:00
回复了 wellwellwell 创建的主题 macOS 如何购买 DeepL API?
@destinism 车还有位子么,怎么上?
2021-12-06 10:47:00 +08:00
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
这个锅和 python 有什么关系?
为啥用 Win10 ?做成随便一个 Linux 多方便
2021-04-19 14:00:37 +08:00
回复了 xatest 创建的主题 分享创造 阿里味编程语言 pua-lang 正式发布!
这这这。。。。。。么油菜,不去阿里可惜了
1  2  3  4  5  6  7  8  9  10 ... 72  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2093 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 46ms · UTC 16:12 · PVG 00:12 · LAX 08:12 · JFK 11:12
Developed with CodeLauncher
♥ Do have faith in what you're doing.