V2EX › lonelygo 的所有回复 › 第 1 页 / 共 72 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6 7 8 9 10 ... 72

❮

❯

78 天前

回复了 andforce 创建的主题 › 程序员 › CNN 模型有没有图像分类/识别的“通用实现”？

你应该找的是 YOLO

91 天前

回复了 twinsant 创建的主题 › Python › 中年高龄开始学习 Deep Learning

@Jinnrry 现在 LLMs 这么火，模型架构基本都手链到 transformer 的自回归部分也就是 decoder 部分。
而，HF （ huggingface ）开源的 transformer 库基本就是所有开源 LLMs 使用的标准 transformer 实现（ Google 除外，坚守自家框架，但也不是 TensorFlow 了，而是用 JAX ）。
又，HF 的 transformer 使用 PyTorch 实现的，所以，过去几年 TF 就逐渐江河日下了，所有新工作，新 paper ，新开源基本都是在 pytorch 下了。
所以，这时候入坑，就当没有 tf 这个框架，也不亏。

93 天前

回复了 twinsant 创建的主题 › Python › 中年高龄开始学习 Deep Learning

@twinsant 22 楼 @ladeo 正解，tensorflow 别用了，被时代抛弃的框架了，直接上手 pytorch2.x 吧。

264 天前

回复了 lonelygo 创建的主题 › 程序员 › 40 岁依然可以奋力前行

@HOYU 额。。。这是为啥

304 天前

回复了 main1234 创建的主题 › 程序员 › [求问] 没学历没基础咋入门 AI 啊

@mantouboji 经验害人啊，这是我写的。

304 天前

回复了 main1234 创建的主题 › 程序员 › [求问] 没学历没基础咋入门 AI 啊

https://zhuanlan.zhihu.com/p/30551539
@mantouboji
@kneo 这个励志不

2023-09-13 10:09:03 +08:00

回复了 Daotin 创建的主题 › 程序员 › 安卓 or 苹果？想听听 V 友们的看法

![image.png]( https://s2.loli.net/2023/09/13/GYuaEgUmM5kTSlp.png)

2023-09-10 12:03:51 +08:00

回复了 honeyjuice 创建的主题 › 宽带症候群 › 上海联通光猫密码改成了随机密码，不再是固定的 CUAdmin 了

@guozi1117 不知道，还在等大神出方案了。

2023-09-09 12:21:08 +08:00

回复了 honeyjuice 创建的主题 › 宽带症候群 › 上海联通光猫密码改成了随机密码，不再是固定的 CUAdmin 了

@guozi1117 我是手贱从桥接改成光猫拨号，看测速到底能不能跑满。现在好了，测速肯定能跑满了。。。。。

2023-09-07 22:53:23 +08:00

回复了 honeyjuice 创建的主题 › 宽带症候群 › 上海联通光猫密码改成了随机密码，不再是固定的 CUAdmin 了

哎，刚登上去，重启一下，登不上去了。。。。

2023-07-21 15:56:06 +08:00

回复了 rabt 创建的主题 › 程序员 › 听说 ml 域名被收回了？你们的还能用吗

我说昨天开始我的 openai 的 API 怎么抽风了😭，怎么也想不到是 ml 的反代跪了

2023-03-13 10:33:24 +08:00

回复了 afit 创建的主题 › 分享创造 › 基于 gpt-3.5-turbo 模型，搭建了 light-gpt,欢迎体验

已🌟

2022-11-29 10:20:58 +08:00

回复了 terrysnake 创建的主题 › Android › 对新出的 VIVO X90 PRO+很心动，求打醒~

@terrysnake 这段时间不是每天都有裁员的各种消息么，今天不知道明天啊。

2022-11-25 10:17:34 +08:00

回复了 terrysnake 创建的主题 › Android › 对新出的 VIVO X90 PRO+很心动，求打醒~

你就不怕明天毕业么🔔

这样打可以咩😁

2022-11-22 10:36:49 +08:00

回复了 lsww 创建的主题 › NVIDIA › AI 卡的工作原理

@lsww 训练推理分开说。
先说推理。目前大模型是有，但是不多，模型也没大到一定要上多机的。毕竟现在 20G 、40G 显存的 GPU 还是有的，模型再大，整个单机多卡足矣。而且这种推理侧的模型拆分，其实就是简单粗暴，把模型切成几片，保证每个分片的 weight 能塞到 AI 卡的 DDR 上去就行，然后多卡组个流水线完事。
再说训练。这玩意就能说几天几夜了。
不管单机多卡还是多机多卡，首先要知道的：
并行计算相关的概念和知识；
然后并行训练的三个名词：数据并行，模型并行，混合并行；
多机的情况下，应为有跨机器通讯甚至是跨机柜通讯，靠网卡那是万万不行的，又要去了解：
各种大规模并行算法的拓扑设计（其实顺手也就了解了物理服务器的拓扑设计），这个有不少经典 paper 可以看；
高性能通讯，那就绕不开 RoCE 和 IB 了，又是知识点；
这些搞明白了，下面就要琢磨下各框架怎么做分布式并行训练的：
前人怎么改造 TF 和 PyTorch 的；
怎么把 TF 、PyTorch 当后端，在上面怼个分布式的轮子（框架）来实现分布式的；
OneFlow 怎么平地起高楼，从头撸一个分布式并行训练优先的框架，怎么保证不改代码单卡、多卡、多机多卡都能玩起来；

基本概念都有了，那么就可以琢磨琢磨哪里有优化点可性能瓶颈了，可以造轮子了。

2022-11-20 11:30:08 +08:00

回复了 lsww 创建的主题 › NVIDIA › AI 卡的工作原理

@lsww 题主不知入行多久，目前在做什么事情，直接点说，这个问题问的并不清楚：
首先：AI 卡可以理解为异构的 AI 计算加速卡。
如果是：`从操作系统角度理解其工作原理`，那么是不是在问：
`异构计算加速平台的计算调度在 OS 层面做哪些工作？`，那对用户来说其实就是：PCIe ，DMA 这些数据搬运相关的事情，其他的比如中断这些，都是厂商软件栈的事情了。
如果是：`AI 加速卡的工作原理`，那么是不是在问：
`AI 加速卡如何做到高效的并行计算，来提高计算效率的？`，那就从怎么做 GEMM 加速，并行计算，这些看起，#2 @kakalala 提的 opencl 是理解并行计算的一个路径，还可以去看看 cuda 的文档，从硬件架构到 SIMT 到 Warp 都有图文并茂的解释。
另外，从技术角度，AI 训练和 AI 推理，看起来差不多，但是从操作系统来看，两者之间的软件差异其实非常大：
推理简单，把主机代码和设备代码确定了，workload 丢给 AI 卡，等回调，主机代码继续干后处理完事。
训练复杂，单机多卡，多机多卡集群，涉及到分布式计算，通讯，模型并行 /数据并行 /混合并行，等一大堆东西。

2022-04-23 10:13:01 +08:00

回复了 wellwellwell 创建的主题 › macOS › 如何购买 DeepL API?

@destinism 车还有位子么，怎么上？

2021-12-06 10:47:00 +08:00

回复了 zictos 创建的主题 › Python › Python 识别图片文字的效果是不是很差？

这个锅和 python 有什么关系？

2021-11-07 16:22:51 +08:00

回复了 mousepotato 创建的主题 › Kubernetes › 请教 5 台物理机器（windows 10）想搭建一个 K8S 集群应该如何操作。比如使用什么平台，有什么注意事项吗？就是玩一玩用。查了下有 Rancher 和 Kubesphere 等，但是还没用过。谢谢

为啥用 Win10 ？做成随便一个 Linux 多方便

2021-04-19 14:00:37 +08:00

回复了 xatest 创建的主题 › 分享创造 › 阿里味编程语言 pua-lang 正式发布！

这这这。。。。。。么油菜，不去阿里可惜了

1 2 3 4 5 6 7 8 9 10 ... 72

❮

❯