一个关于蓝宝石5850挖矿死机的问题,我将用BTC支付给第一个提出有效解决线索的

2011-06-25 17:57:01 +08:00
 milazi
我有5块 蓝宝石 HD5850 Extreme的显卡
两块主板分别是技嘉 GA 870A和MSI的890 FXA GD70
CPU两块是 240、140分别插在技嘉870和MSI 890上。
技嘉主板上使用的是4GB的SSD固态硬盘
MSI主板上用的金士顿4G U盘当硬盘
技嘉主板插了两块5850,使用了600W的电源,MSI主板插了三块5850,使用了1200W的电源
内存均为2GB,都安装了Ubuntu 11.04系统

问题:

使用 “aticonfig --odgc --adapter=all ”查看显卡状况,可以看出显卡核心频率可以运行在接近900Mhz:

Adapter 0 - ATI Radeon HD 5800 Series
Core (MHz) Memory (MHz)
Current Clocks : 800 900
Current Peak : 800 900
Configurable Peak Range : [550-900] [900-1250]
GPU load : 99%
(一共三张显卡,信息都和上面一样。)

我使用Phoenix连接到矿场开始挖矿,将三个显卡都运行起来之后,又将显卡核心频率设置到大约850Mhz,显存频率由1250降到900Mhz的时候,就出现了问题:三张中开始有一张显卡失去响应,且可以查看这张卡的温度由运行状态时候的60~70度下降到40~50度,我感到这张显卡开始失去响应,后来直到整个系统失去响应而必须在机箱上按按钮才能重新启动。
为了排错,我将失去响应这块显卡换下,使用另外一台矿机上的显卡换上,开机设置并超频后运行挖矿程序,结果一样,有时候在825Mhz的情况下就会死机。为了继续排错,我将这出错矿机上的1200W的电源安装到装了两张显卡的技嘉主板上,(因为技嘉双显卡也是一样出现了这个问题),技嘉+双显卡使用600W电源的情况也总是在这个频率下会有一张显卡失去响应导致最终系统死机,我怀疑是电源问题,但是在更换了1200W的电源的情况下,仍然无法使两张显卡运行在较高的速度下,现在五张显卡都只能运行在核心800Mhz显存900Mhz的速度下。每张显卡的计算速度为大约308Mhz/s。而这离常规的大约340~350Mhz的速度还是挺有差距的


如果提出有效建议或排错可能,经过我试验解决了问题,或任何能将显卡同时运行在350Mhz的速度下的方案,请留下你的BTC地址,我将使用BTC支付我所获得的帮助。
7972 次点击
所在节点    Bitcoin
44 条回复
jiangchun9981
2011-06-25 18:31:48 +08:00
3块卡插一张板上,总有中间的卡,或后面的卡会过热的,因为散热风扇吸入的空气是前面的卡排出的热空气,所以的分别调整各个卡的频率。 不是每块卡都能跑同样高的频率。蓝宝石 HD5850 Extreme我这跑比较稳定的频率是850M(参数V2,W128,如果w256,可以跑900M,但是产量不高)。Phoenix的参数也影响稳定还有温度的,要仔细调整。
Livid
2011-06-25 18:38:18 +08:00
楼主没有用额外的降温手段?
milazi
2011-06-25 19:07:21 +08:00
@jiangchun9981 多谢提供思路和参数,我试试
milazi
2011-06-25 19:09:47 +08:00
@Livid 有,风扇猛吹,温度我一分钟内多次查看没有超过80的时候
milazi
2011-06-25 19:46:29 +08:00
刚才做了一个测试:将前两张显卡均设置为核心频率900,显存频率1000,这个时候单张运行每张都很稳定,速度稳定在346Mhash/s,但是双卡同时运行就会死机(与此同时,还有一张显卡处于空闲状态),然而三张若是都只运行在800Mhz,那就相安无事,问题出在哪里呢?电源不够不稳定?(但是是长城1000W的电源呢,之前说错了说成1200W了)。
nakowa
2011-06-25 20:08:33 +08:00
就是电源问题。额定1000w不够……超频的瓶颈其实就是电源。email我: nakowa@21bitcoin.com
paidai
2011-06-25 20:29:36 +08:00
内存也太小了 加到4GB吧
milazi
2011-06-25 20:33:27 +08:00
@nakowa 多謝,mail on the way
ideeinfo
2011-06-25 20:37:33 +08:00
5块5850 除了羡慕还能说什么呢
nakowa
2011-06-25 21:00:56 +08:00
跟内存没关系……
wr1124
2011-06-25 21:01:34 +08:00
试试新出的11.6驱动,我用的guiminer挺稳定的,楼主可以试试
virushuo
2011-06-25 21:51:31 +08:00
因为linux没有win那样的VPU recovery的机制,所以过热就会停止响应,只能重启。可以写个脚本,问题太高就降频。

显存降频也解决不了这个问题。
milazi
2011-06-25 22:14:01 +08:00
@virushuo 也许我应该考虑装windows
fcicq
2011-06-25 22:33:29 +08:00
感觉和偶曾经遇到的问题有点相似. 应该是电源问题? 不过偶之前见过的是还没等跑就死了, 此时频率肯定是很低的.
xi_lin
2011-06-26 00:57:16 +08:00
5850的满载正常的时候应该是170W左右,你超到900的话拿200W算1000W电源应该也能压的做,我不知道你的长城电源的型号,但是你先得确认你的电源是足额的,最好能有工具测测峰值功率。
当然一张卡停止响应这种事我感觉和电源关系不大。好像你的三卡MSI也是小板?小板接三卡感觉略暴虐啊。蓝宝这5850 PCB是拿6850改的,本身就不太适合默频超那么高,不知道你电压加多少。
另外,Phoenix的稳定性好像也不如poclbm,你可以换着试试。
总结来说就是我推荐你不要追求那么高频率,保证电源与散热,慢慢来。
virushuo
2011-06-26 01:09:38 +08:00
@milazi 应该是想办法降温。我打开机箱用一个电风扇对着吹,就没出过这问题。或者写一个脚本根据温度降频也可以。windows只会让显卡更热。
milazi
2011-06-26 02:04:18 +08:00
多谢各种建议,各种分析,按一楼 @jiangchun9981 的思路,稍微提高了一下并且可以让系统稳定运行在一个中间的位置,但是也只能是两张显卡上去了,第三张仍然只能处于比较低的运行速度。问题依然存在:

为什么在电源应该足够的情况下,其中一张显卡停止响应,进而导致系统死机,而这个过程中温度却是没有问题的。这个问题仍然没有解决。希望有高手。

@virushuo 风扇是非常有效且廉价的散热方式,我有用。那种脚本不知道是不是这种东东? https://github.com/jsidhu/Bitcoin-Miner-Script

@xi_lin 这个电源是巨龙1000,这个MSI板载5个显卡插槽。应该是大板?我并不十分清楚这种规格的东西,没有加电压,嘿嘿,加电压可能又是一个非常复杂的故事,我学不会了。哈
virushuo
2011-06-26 03:43:11 +08:00
@milazi 这个好像不管温度。你觉得死机温度正常,是因为GPU已经停止工作了,等你去看的时候温度就下降到正常了…或者你可以换win试试看,应该能看到VPU recovery
panlilu
2011-06-26 09:34:48 +08:00
各位挖矿的大神,没钱攒矿机,我就是路过一下。
milazi
2011-06-26 10:05:28 +08:00
@virushuo 换大风扇比换到win简单,上午就试试

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/14953

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX