V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yanaxiao
V2EX  ›  问与答

畅网 N100 软路由死机频繁, PVE + 爱快 + IstoreOS 配置,换硬盘后仍未解决,求助!

  •  
  •   yanaxiao · 1 天前 · 1472 次点击

    大家好,

    我家使用的是畅网 N100 软路由,安装了 PVE 作为虚拟化平台,配置了爱快做主路由,IstoreOS 做旁路由,硬盘是刚刚更换的铠侠 SD10 ,1TB ,内存为 16GB 海力士。

    问题是,设备经常死机,系统死机时硬盘灯不亮,只有重启后才能恢复正常,硬盘灯会闪烁。每次死机后需要强制重启才能恢复,而每次重装 PVE 系统后,最多能坚持一个月左右,之后问题再次出现。

    现象: • 死机时,网口灯正常闪烁,但硬盘灯不亮。 • 手摸机器,感觉超级烫,可能是过热问题。

    在最初,我怀疑是 IstoreOS 旁路由问题,已经设置了旁路由每天自动重启,但问题依然没有解决。

    更换硬盘前,老硬盘也有类似问题,最后几次强制重启都没用,每次都需要格式化硬盘并重装 PVE ,且死机的间隔时间越来越短,一开始是 30 天,最后仅能坚持 3 天。

    新硬盘情况:目前新硬盘强制重启系统后不会立即挂掉,但系统的维持时间越来越短,现在是 15 天、7 天、3 天,下一次死机时间无法预测。

    目前排查的情况: • 设备配置:畅网 N100 软路由,PVE 虚拟化 + 爱快主路由 + IstoreOS 旁路由,硬盘为铠侠 SD10 ,1TB ,内存 16GB 海力士。 • 现象:死机时网口灯正常闪烁,硬盘灯不亮,机器非常烫,需重启才能恢复,重装系统后最多能坚持一个月。 • 历史问题:换硬盘前,老硬盘也频繁死机,强制重启和重装 PVE 均未能解决问题。最后几次强制重启都无效,需要格式化硬盘并重装,死机时间间隔逐渐缩短,从 30 天到 3 天。

    怀疑问题: 1. 电源问题:电源是否稳定,是否供电不足导致死机? 2. 硬件兼容性或驱动问题:是否存在硬件不兼容或驱动问题,导致系统不稳定? 3. 散热问题:设备过热是否导致死机?是否需要更好的散热方案? 4. PVE 配置问题:PVE 和虚拟机的资源配置是否合理?

    37 条回复    2025-03-27 13:06:27 +08:00
    ysc3839
        1
    ysc3839  
       1 天前
    建议先排查散热吧,打开盖子用个小风扇吹,看看有没有问题就知道了
    jiaoguan1688
        2
    jiaoguan1688  
       1 天前
    我想回贴告诉你,畅网很垃圾
    我买的万兆畅网也不行了
    jiaoguan1688
        3
    jiaoguan1688  
       1 天前
    你的问题我感觉是 cpu 过热了
    但是也排除下内存问题吧先
    kk2syc
        4
    kk2syc  
       1 天前
    99%供电不足
    Int100
        5
    Int100  
       1 天前 via iPhone
    大概率硬件问题,搞一台二手服务器跑 PVE 吧
    ashes1122
        6
    ashes1122  
       1 天前
    把机器盖子打开。
    laminux29
        7
    laminux29  
       1 天前
    科普一下硬件维护,新电脑买回来后,要做几个检查:

    1.内存条检测,用 memtest86+,至少跑 48 小时,不能有红字报错。

    2.每个硬盘、SSD 要做 3 项检测:全盘读写检测、性能检测、S.M.A.R.T 检测。

    3.满负载测试:双烤 3 天检测,记录功耗与温度曲线。
    wq2016
        8
    wq2016  
       1 天前
    供电、SSD 、散热,就这 3 个问题,自己排查吧
    godwei
        9
    godwei  
       1 天前
    是不是这硬盘发热量太大了
    Excepti0n
        10
    Excepti0n  
       1 天前
    换个内存试试
    akvo
        11
    akvo  
       1 天前 via Android
    遇到过差不多状况,直接返厂了
    ofnh
        12
    ofnh  
       1 天前
    N100 发热挺大的,先加个风扇试一下吧
    keengrass
        13
    keengrass  
       1 天前
    最有可能是过热
    yinmin
        14
    yinmin  
       1 天前 via iPhone
    大概率是 cpu 过热没有降频,导致 cpu 死机。

    进 bios 调整一下散热设置。windows 系统下 cpu 温度过高会降频,pve 没这个功能,风扇和降频依赖 bios 。
    vmebeh
        15
    vmebeh  
       1 天前
    遇到过 N5105 发热大了 SSD 掉盘的情况,接了显示器才看到一堆内核错误,这时 SSD 挂了没法写日志
    yinmin
        16
    yinmin  
       1 天前 via iPhone
    升级 bios ,实在不行,可以试试 pve 转 windows 的 hyper-v ,windows 有 cpu 过热降频的
    hefish
        17
    hefish  
       1 天前
    感觉是板载的东西可能有问题,最大嫌疑是 cpu 或者跟 cpu 相关的控制器之类的。。 应该不是散热。应该是 cpu 体质或者南桥北桥之类的。
    Qazxcv123
        18
    Qazxcv123  
       1 天前
    @laminux29 #7 一般正常家用电脑,买回来默认设置,也不用搞这么多压测吧
    kokutou
        19
    kokutou  
       1 天前 via Android
    找售后❌
    上 v2 输出✅
    laminux29
        20
    laminux29  
       1 天前
    @Qazxcv123 这就是传说中的纪律性了。如果你愿意赌产品质量,当然可以选择不做测试。
    Yuchi
        21
    Yuchi  
       1 天前 via Android
    可能与固件版本和配置有关,网上搜一下"爱快 死机",不少人遇到同样的问题。
    sunulin
        22
    sunulin  
       1 天前
    硬件问题,我的不小心碰一下就会死机。红屏 我装的 EXSI ,给我售后了两个月 才弄回来,回来了 4 个网口 有一个坏掉了 ,过了两个月又犯病了。。
    Y25tIGxpdmlk
        23
    Y25tIGxpdmlk  
       1 天前
    @keengrass #13 最没可能是过热,过热一般降频或卡顿。
    死机多半是内存或硬盘啥的硬件问题
    davidyin
        24
    davidyin  
       1 天前 via Android
    幾個系統都放在一起就不太好判斷,最好還是專門配路由,別放在 PVE 裡面。
    vinsony
        25
    vinsony  
       1 天前
    大概率就是最近气温升高了,几块钱买个 USB 的风扇一直吹就行了
    exkernel
        26
    exkernel  
       1 天前
    检验判断是内存
    IvanLi127
        27
    IvanLi127  
       1 天前
    把虚拟机全停了,在宿主机烤机看看。排除一点是一点。不过我感觉是掉盘了
    VwEI
        28
    VwEI  
       1 天前
    首先换个电源看看
    Logtous
        29
    Logtous  
       1 天前
    建议直接安装一个 x86 immortal openwrt 到设备上观察运行一段时间,如果一切正常那就是系统层面的问题,感觉都已经是多网口设备了,为何不直接软路由系统,pve 虚拟机虽然死可以多虚拟机,但 openwrt 基本上也是一个全能系统(我设置用 openwrt 组了 raid1 来做 nas )软路由+ap 简单清晰明了的网络布局 比旁路由简单多了
    HK560
        30
    HK560  
       1 天前
    我的也是 n100 ,我感觉这发热是得上风扇的
    TobeRey
        31
    TobeRey  
       1 天前
    PVE ?我的是 N5105 ,频繁死机,查日志老是卡死在每日定时更新,关了以后就好了。
    `systemctl disable pve-daily-update.timer`
    Fooooo0
        32
    Fooooo0  
       1 天前
    我也是畅网 N100 ,大背头版,也是 PVE ,已经运行 550 天 没重启过了
    chnsatan
        33
    chnsatan  
       1 天前
    两个问题建议排查下
    1 、看日志,PVE 有个毛病,Intel NIC e1000e hardware unit hang ,导致 PVE 整个系统崩溃
    2 、加个风扇,N100 散热通病
    TNOK
        34
    TNOK  
       23 小时 48 分钟前
    用的是 1215U ,12 代装 PVE 有 C 状态睡死的问题,表现也是网口正常亮,grub 里修改最大 C 状态为 2 可以解决。
    pinyoung
        35
    pinyoung  
       23 小时 20 分钟前
    我的 n100 零刻,风扇坏了照样跑,功率降低了,不会死机,之前装 esxi 的时候会死点,pve 基本上全天 90%负载跑,温度 cpu 差不多 89 度全天,没事
    ysc3839
        36
    ysc3839  
       20 小时 40 分钟前
    @laminux29 建议直接跑 y-cruncher ,其他内存检测工具压力都不够大,有问题可能要跑很久才报错,相比之下 y-cruncher 能更快发现问题。
    sanquan
        37
    sanquan  
       7 小时 30 分钟前 via iPhone
    找畅网退换
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3167 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 12:36 · PVG 20:36 · LAX 05:36 · JFK 08:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.