双 2080ti 电脑跑程序经常重启的问题

2021-05-13 15:08:03 +08:00
 cowarder

这几天组装了一台双 2080ti 机器,用来跑深度学习模型,但是经常会跑一会就出现重启,甚至直接进入 bios 了,通过 nvidia-smi 对于显卡温度的观察,同时使用两块卡的时候,第一块的温度上升速度高于第二块卡,一般达到 80 度左右就会重启,初步怀疑是显卡的问题,调换显卡后还是相同位置的显卡温度过高。请问大家可能是什么原因呢,如何去解决,目前想的解决方案是加 gpu 水冷,或者加大风扇力度,不过还是不太明白为什么只有一块卡温度上升的快。电脑配置如下:

显卡:两块技嘉 RTX2080TI 固态:三星( SAMSUNG ) 1TB SSD 固态硬盘 M.2 接口(NVMe 协议) 970 PRO ( MZ-V7P1T0BW ) CPU:英特尔( Intel ) i9-10850K 10 核 20 线程 盒装 CPU 处理器
电源:美商海盗船 (USCORSAIR) AX1600i 1600W 电脑电源(全模组数字 /80PLUS 钛金认证 /十年质保) 机箱:美商海盗船 (USCORSAIR) 780T 黑色 全塔机箱(侧透 /支持 E-ATX 主板 /3 速风量调节 /4 组水冷位 /35CM 显卡)
主板:玩家国度( ROG ) ROG STRIX Z490-A GAMING 吹雪主板 支持 CPU 10900K/10700K ( Intel Z490/LGA 1200 )
内存:四块金士顿(Kingston) DDR4 2666 16GB 台式机内存条
水冷:九州风神( DEEPCOOL ) 堡垒 360 CPU 水冷散热器 幻彩 RGB 版(一体式水冷 /静音 /3 个 ARGB 风扇 /稳压 I9/标配硅脂)

1037 次点击
所在节点    问与答
3 条回复
cowarder
2021-05-13 15:09:30 +08:00
排版出现问题,评论里再放一下

显卡:两块技嘉 RTX2080TI
固态:三星( SAMSUNG ) 1TB SSD 固态硬盘 M.2 接口(NVMe 协议) 970 PRO ( MZ-V7P1T0BW )
CPU:英特尔( Intel ) i9-10850K 10 核 20 线程 盒装 CPU 处理器
电源:美商海盗船 (USCORSAIR) AX1600i 1600W 电脑电源(全模组数字 /80PLUS 钛金认证 /十年质保)
机箱:美商海盗船 (USCORSAIR) 780T 黑色 全塔机箱(侧透 /支持 E-ATX 主板 /3 速风量调节 /4 组水冷位 /35CM 显卡)
主板:玩家国度( ROG ) ROG STRIX Z490-A GAMING 吹雪主板 支持 CPU 10900K/10700K ( Intel Z490/LGA 1200 )
内存:四块金士顿(Kingston) DDR4 2666 16GB 台式机内存条
水冷:九州风神( DEEPCOOL ) 堡垒 360 CPU 水冷散热器 幻彩 RGB 版(一体式水冷 /静音 /3 个 ARGB 风扇 /稳压 I9/标配硅脂)
3dwelcome
2021-05-13 15:14:30 +08:00
Windows 下显卡原因的蓝屏重启,是会有 crash dump 报告的,打开后能查到确切原因。

显卡 80 度,感觉完全在可接受范围内。
elmagnificogg
2021-05-14 09:20:03 +08:00
大概率是电源有问题,换个电源试一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/776727

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX