威联通硬盘 I/O 读写错误,是坑位的问题吗?

2022-12-14 11:01:04 +08:00
 sleepingdog
TS453Dmini ,最近两个月内的大操作有:升级到了最新固件,双十一的时候,加了一条光威 16g 内存条,总共 20g 现在。然后就是加内存条的一周之后,就 4 号位就出现 IO 读写问题

我拿 3 和 4 的对调,然后磁盘——扫描坏块里面操作清楚了错误,然后隔几天后,4 号位置的硬盘(就是原来的 3 号硬盘又出现 io 错误)
我拿 2 和 4 对调,同样上述操作,然后依然是 4 号坑位(也就是原来的 2 号硬盘)出现了问题。。。。。

4 个硬盘都是是西部数据和海康搞的 4t 紫盘,一起组了 raid5

球熟悉的老哥们指点下~
3316 次点击
所在节点    NAS
26 条回复
sleepingdog
2022-12-14 11:04:54 +08:00
补充下图片:
kokutou
2022-12-14 11:07:13 +08:00
杂牌内存问题吧。。。
买什么内存不好买杂牌。。。

英睿达,三星,科赋,哪个不比杂牌好。。。
sleepingdog
2022-12-14 11:13:51 +08:00
@kokutou #2 内存条的锅也能跟硬盘扯上关系吗?这有点离谱。。。
不过网友的确是有说过只能加特定的牌子,我看到光威在上面就加了。。
jaswer
2022-12-14 11:29:35 +08:00
不懂就问,盘位还能随便换么?
hongdengdao
2022-12-14 11:30:50 +08:00
同型号,这款插槽第 3,第 4 有兼容性问题,我的第 3 道有兼容问题,我把硬盘插到第一道,第 3 道换 ssd 就好了,之前机械硬盘插第 3 道没几天就报错
hongdengdao
2022-12-14 11:32:28 +08:00
换了硬盘也报错,我开始以为是京东买的硬盘的问题,换了一次,
后来以为是 vps 的问题,也不用 vps 了
后来偶尔在论坛看了说是有兼容性问题
就换了 ssd 放第 3 个插槽,到目前为止都正常
sleepingdog
2022-12-14 11:41:16 +08:00
这是当初看的关于内存的帖子
https://tieba.baidu.com/p/7085043074?pn=2
问了淘宝的客服,说 4g 的版本的内存是 2666mhz
我买点是光威的 16g ,2666mhz 。
之前感觉是坑位问题,现在打算先换下内存条看看。这错误不是一下子就能冒出来,要等几天,这 bug 真是磨人的小妖精。。。
sleepingdog
2022-12-14 11:43:15 +08:00
@jaswer #4 可以吧。。。
还说可以热插拔,我是不太熟这些所以都是关机再操作。。。
sleepingdog
2022-12-14 11:55:52 +08:00
@hongdengdao #6 你的 QTS 有没有更新到 5.0 以上啊,还有内存条有没加?
感觉 5 有很大问题,然而不更新又怕勒索病毒和漏洞。。。
我都没开外网访问
collery
2022-12-14 12:10:53 +08:00
我买的海康的也是 io 错误,不到三个月,但是坏道很多,里面放的是家里的监控,没办法寄修,现在扔在那。ps:无法格式化,电脑无法识别
sleepingdog
2022-12-14 12:23:34 +08:00
@collery #10 我倒是没做监控。。。也没搞 bt ,pt 之类,
但我的 “问题硬盘” 换了位置,使用威联通自带的坏道扫描,清除 IO 记录之后就没变红,倒是 4 号坑位时不时冒出红来
overwatch
2022-12-14 12:35:23 +08:00
和 OP 同型号,昨天出现相同的故障,在此之前也多次出现这个问题,看网上说是 QTS 5.0 的 BUG
我每次都是重新对 4 号盘执行扫描坏块(时间很长,4T 盘大概要 18 小时左右),然后就会自动恢复正常
kokutou
2022-12-14 12:47:58 +08:00
@sleepingdog #3
海康也是杂牌,硬盘为啥不买西数希捷日立的 cmr 盘。
sleepingdog
2022-12-14 12:48:51 +08:00
@overwatch #12 这个 smart 快速测试和完整测试有没有开启?
https://imgur.com/yYdEjzf.jpg
似乎开启之后就更容易弹出来(默认是关的)


我这次是尝试假装不测试了就不存在问题了,但重启之后这个问题又冒了出来。
overwatch
2022-12-14 13:11:03 +08:00
@sleepingdog #14 开启了快速测试,每周六凌晨一点执行。这个 I/O 读写错误,重启没用。要么扫坏块,要么改配置文件清楚报错
ungrown
2022-12-14 14:12:38 +08:00
能不能看到完整的 smart 数据表啊,只说笼统的 io 错误,不知道具体是什么。
如果是“硬件 ECC 校正 Hardware ECC Recovered”、“UDMA_CRC_Error_Count”之类的数据显示有计数,那么问题可能出在 SATA 线、SATA 头、硬盘背板这些传输环节上。我自己遇到过几次这种情况,有一次是换了一根 SATA 数据线就好了,另一次则是 SATA 一拖多供电线接触不良换了电源线也好了。无论如何,先看看完整的 SMART 数据,看看到底是哪一项记录异常,然后再说。
单纯看你的描述,现象和盘位高度关联,而背板和接口出问题的可能相对较小,要我现在猜的话,我还是第一个猜是 SATA 线的问题,数据线比供电线的可能性高。
sleepingdog
2022-12-14 15:06:10 +08:00
@ungrown #16
不太理解,你说的 smart 数据表和这个威联通自带的 smart 是一样的东西吗?我好像没有找到你说的几个项目


这个机器的 sata 口是直接在板子上的,没有线
ungrown
2022-12-14 15:20:20 +08:00
@sleepingdog #17 看来我的经验不适用

先把涉事硬盘扫一遍,确认有没有坏块。
网上找到的资料,都不能算是彻底的修复,也没有详细解释其中原因。
https://post.smzdm.com/p/anxr0wnv/
https://www.reddit.com/r/qnap/comments/bxm7hu/clearing_disk_error_status_on_qnap_nas/
https://bjeager.blogspot.com/2022/07/fix-disk-read-only-and-rw-error-on-qnap.html
ungrown
2022-12-14 15:21:50 +08:00
@sleepingdog #17 补充:拿出来用别的设备扫,别用这台 nas ,因为不知道 nas 里面是不是有什么幺蛾子
sleepingdog
2022-12-14 17:37:28 +08:00
@ungrown #19 感觉自己像那个 reddit 的 tvs471 老哥一样,认为自己的硬盘没事。。。
不过现在手头只有一个笔记本,搞不了这个 sata 设备啊。。。大概只有折腾的时候才意识到插座数量和种类越多越快乐

感觉还是排雷+一边找客服 /一边问老哥们看看。关键是这排一个雷,等问题再现可能也要几天。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/902404

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX