V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Ayahuasec  ›  全部回复第 1 页 / 共 12 页
回复总数  222
1  2  3  4  5  6  7  8  9  10 ... 12  
“研究生+要解决实际问题” 看到这两个条件,我感觉可以了解下 MatLab ?学校没买授权也不想掏钱买学生版的话,可以用开源的 Octave 平替。

MatLab 的文档很全,学过 Python 的话上手也应该很快,而且有问题也可以问 AI 。比如如果需要数据支撑或者论证观点的时候,就可以问 AI 需要什么数学工具或方法,然后用 MatLab 实现,以及可以输出合理的图可以放进论文里之类的。感觉可能对 op 的主业会比较有帮助。
61 天前
回复了 wxd21020 创建的主题 NAS 配置小主机跑大模型
我在用 N100 的小主机跑 q4km 量化的 14b 的 qwen ,机器装了根 32G 的内存,效果还可以,就是速度大概只有 2-3 tokens/s ,而且跑的时候风扇狂转
61 天前
回复了 857681664 创建的主题 旅行 2024 春节厦门游记
以前听同学说厦门应该中秋去,中秋比较热闹,那边过节能过上一个月
我记得是命令 nvidia-smi -pl 10 就能设定限制功耗在 10W ,可以按自己的卡调一调,但是这只是软件限制,实际跑起来还是有可能超过设定值。以前测试是可以略微降低一点点待机功耗,但是台式机的话好像意义不大,笔记本可以在独显闲置的时候挤出来点电池续航时间。
4060ti 16G 已经能跑不少东西了

预算再往下还有条 Tesla P100 16G 的野路子
170 天前
回复了 flypei 创建的主题 VPS 阿里云 ECS 2C2G 3M, 99/年,已入手
本来下单以后还觉得挺便宜的,然后发现阿里云的 IPv6 还要额外开通,1Mbps 是 0.96 元/天。国外 VPS 基本上 IPv6 都直接送的,到阿里云这要额外收费了…
193 天前
回复了 allmightbe 创建的主题 程序员 DDR 的交织原理有点不理解?
@allmightbe #18 修一个上一个回复(#19 )的 bug ,看到你这张图我想起来了,BL=8 的时候列地址的低 3 位也是不用的,保持为 0 。列地址一般是 10 bits ,上面这个例子其实应该是{row[15:0], column[9:3], bank_addr[2:0], 6'h0},或者也可以说是{row[15:0], column[9:3], bank_addr[2:0], column[2:0], 3'h0}。
193 天前
回复了 allmightbe 创建的主题 程序员 DDR 的交织原理有点不理解?
@allmightbe #17 一个 column 对应的是多个 bits ,比如 x16 的颗粒是 16 bits ,如果一个控制器连的所有颗粒总计 DQ 是 64 位(比如一个 dimm ),就需要 4 个 x16 的颗粒,那这种情况下每个 column 地址其实是 8 bytes 。对应到按 1 byte 的字节的地址空间,其实是低 3 位不用。

举个例子,假如说地址空间是 32 位,那 Row-Column-Bank 编址可能是{row[15:0], column[9:0], bank_addr[2:0], 3'h0},这样连续读写可以用到所有 Bank 。

未对齐的访问一般在 Cache 端的控制器做,或者用 CPU 的异常中断做,Cache 到 DDR 一般只让对齐访问。
199 天前
回复了 allmightbe 创建的主题 程序员 DDR 的交织原理有点不理解?
@allmightbe

关于缓存,我印象里每个 bank 是有一个 row buffer 的。

一次性取 8 个字节,大概是因为 DIMM 的位宽是 64 bits 的吧(带 ECC 是 72 bits ,不过有效数据还是 64 bits ),但是实际上 burst length 对于 DDR4 的情况是常用 8 (因为好像从 DDR3 开始 prefetch 一般都是做的 8n ),也就是说一次连续的读写会涉及到 64 bytes 。如果要在一次读写中只让部分数据有效,一个是会用到 Data Mask 引脚,把部分数据位掩码掉;另一个是 burst chop ,让 burst length 变为 4 。但是如果都是短字节的随机读写,就会让 DDR 接口上一次读写操作中有大部分数据是浪费的。所以 CPU 里要做 Cache ,在需要的时候按 Page 为单位和 RAM 做数据交换,从而把内部比较随机的 RAM 读写变成相对连续的 DDR 读写。

不过关于一次读写的数据长度这一点上,我理解这个还是要和具体的 DDR 控制器设计相关的,我见过的一个用到 DDR 的设计是一个 Memory Channel 只带 2 个颗粒,DQ 位宽 16 bits ,burst length 固定为 8 ,这样的话发出一个地址请求,就会读写 16 bytes 的数据,内存控制器的地址是按 0x10 对齐的,也就是地址的低 4 位只用于配合读写长度进行字节的提取,但是 DDR 控制器到内存颗粒上总是一次读写就是连续的 16 bytes 。
200 天前
回复了 allmightbe 创建的主题 程序员 DDR 的交织原理有点不理解?
DDR 控制器发出列地址以后,需要等待一段时间才能读写数据,在此期间可以多发几个地址,延迟时间到了以后连续读写。这样性能比较高。
DDR 跨行访问要先把当前行关掉,再打开新的行,这个步骤会引入额外的延迟。(或者考虑用自动预充电)
每个 Bank 是相对独立的,可以同时打开多个 Bank 的行。多个 Bank 只是共享了一个 DDR 的接口。
实际设计为了提高随机读写性能,我见过的比较多的设计是按 Row-Column-Bank 去编址的。
可以看一下 micron 的内存颗粒文档的时序图,我记得是比较全的。
204 天前
回复了 cloud2000 创建的主题 问与答 有人用过那种迷你的 N100 小主机做 NAS 吗?
@icySoda 给 lxc 开了 fuse 的话直接内部挂载也是 ok 的。主机挂载 NFS 的话也可以支持多个 lxc 共用一个下载路径,不过多个 lxc 内部分别挂载同一个 NFS 也是可以做到的共用的。反正看自己怎么管理方便吧。
205 天前
回复了 cloud2000 创建的主题 问与答 有人用过那种迷你的 N100 小主机做 NAS 吗?
@icySoda 不是大佬,交流一下折腾经验吧。

我是所有数据在单独的 NAS 上的,在局域网开了 NFS 服务。然后下载机上用的是 vm ,实际上 lxc 也是可以的。我感觉 vm 的好处就是磁盘可以用 fstrim 从而只占用实际数据的空间,而 lxc 的好处就是节省 RAM ,但是 lxc 分配的 lvm 里的硬盘空间是独占的。

虚拟机和容器系统我是一直用的 Debian 。

数据盘通过 NFS 挂载(虚拟机直接挂载 NFS ,lxc 容器在主机挂载 NFS 后映射到容器内),下载的文件直接进 NAS 。下载软件方面的话,我是用的 aria2 下载一般文件,通过 AriaNg 进行远程控制,BT 是交给 transmission-daemon ,有自带的 web 界面也有第三方的方案。

另外如果手头还有 VPS ,下载软件放在 vm 或者 lxc 的话,可以用 tinc 、wireguard 等等方案建立一个到 VPS 的网桥,本地虚拟网卡接入到网桥中,然后把 VPS 作为下载机上虚拟网卡的默认网关,并用 iptables 配置好 ipv4 的 NAT 和端口映射,有 ipv6 网段的话配置好 ipv6 的路由,这样本地就相当于有公网了,而且所有数据直接经由 VPS 下载到本地而不用存放在 VPS 。这个方法主要是为了在下载一些冷门资源的时候,用线路比较好的 VPS 更容易连上 peer 。
我之前用过 VMware 的 Thinapp ,不过 Thinapp 的原理是先把当前系统扫一遍,然后你进行安装软件、完成软件配置,然后 Thinapp 再把系统扫一遍,把所有的改动收集起来。这一步完成的时候已经可以看到这个软件安装后进行的所有改动了。然后 Thinapp 还可以把这个改动打成一个包,分发到其他系统上就可以免安装直接使用了。
Debian 两年发布一个稳定版,我几个服务器都是 Debian ,跟着两年更新一次内核版本就 ok 了,问题不大
231 天前
回复了 linuxgo 创建的主题 Linux Linux 下有没有可以远程连接 win7 桌面的软件
@linuxgo #4 我之前用 Ubuntu 的时候遇到过 snap 安装的 remmina 闪退,原因好像是权限没给全,可以检查一下,或者不用 snap 的版本
你检查 pc 上加速器是不是创建或者桥接了一个虚拟网卡,ip 是 172 开头的。一个内网可以跑多个网段的,主机通过 172 这个网段连接 pc 加速器虚拟网卡,然后再通过加速器的软件出去。
255 天前
回复了 cloud2000 创建的主题 问与答 有人用过那种迷你的 N100 小主机做 NAS 吗?
正在用 N100 的 EQ12 当主路由、下载机和转码机,系统是 ProxmoxVE ,之前连续跑了几个月没问题,上个月更新到 PVE8 的时候重启了一下,到现在连续运行 36 天了,个人感觉很稳定
@Num6 多谢推荐。我大概看了下,好像这几个都是前端设计用的库?我没写过前端,要用起来可能还得学一下。
@dioxide 多谢推荐,看了一下这个软件功能比较多,我抽空学习一下看能不能方便地做我这种需求的图
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   955 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 22:26 · PVG 06:26 · LAX 15:26 · JFK 18:26
Developed with CodeLauncher
♥ Do have faith in what you're doing.