Ubuntu 服务器多线程不稳定,数据 md5sum 经常变

269 天前
 faoisdjioga

在做生物信息学分析过程中,用到的软件为 R/python ,和一些其他生物分析常用软件,在跑多线程任务时候经常出问题。

1 ) 多线程任务

1.1 ) 比如,Error in unserialize(node$con) ,还有一些 warning ,说是线程没有返回结果(还有其他一些线程错误代码)

1.2) R 和其他的软件在跑多线程的时候,用的__好像__是 c++, 是我 c++还需要进行适配嘛?

1.3) 我 python 跑一些多线程任务时候好像就比较稳定。

2 ) 有些数据存储过程不稳定

2.1 ) 下载的生信数据(fastq.gz)md5sum 不知道什么原因就变了(数据有些 quality, reads 长度不一致),数据不可用

2.2) 但我的一些其他数据好像没有问题,一些基于 R/python 存储的对象,csv ,txt 的超大表格等,没有问题,可以正常读取,数据重新跑,结果也能完美重复,但是我没有 check 过 md5sum

尝试过的解决方法

1 ) 重装系统,

2 ) 换硬盘(固态 -> 硬盘 -> 固态),硬盘挂载方式也从 lvm -> 直接挂载

3 ) ubuntu 桌面卸载

4 ) 换软件版本(尝试了超多的版本)

都不行

后来用公司服务器跑就没有什么问题(公司用的是铂金的 cpu )。采取和我本地电脑相同的软件配置,相同的数据。

1 ) 数据稳定

2 ) 一些软件没有报错

目前我只能暂定认为是硬件稳定性不好,

吐血求助: 到底是哪里问题,1 )是家用主板是不是当不了 server ,2 )还是我个人配置问题,3 )还是我硬件没有氪金上高档的。

我的配置是

CPU 12700 (散片),

主板 MSI-B660M ,

内存 DDR4 asgrad 32GB x 3 ,16GB x 1 ( 22 年购买,用的是网上相对很便宜的 DDR4 )

系统 Ubuntu

1852 次点击
所在节点    Linux
11 条回复
a22271001
269 天前
看程序代码
LittleSho
269 天前
内存用 memtest86 跑 4 圈看看有没有 error
CPU 用 intel 处理器诊断工具跑一遍试试(需要在 windows 下跑)
weidaizi
269 天前
😂 md5sum 变了这个还有可能是硬盘的问题,但是 OP 说线程返回错误,这个锅都要系统/硬件来背是不是夸张了
而且啥代码都不贴,给个报错信息,别人怎么知道是什么错误?
kkkbbb
269 天前
操作系统多线程不稳定,头一次听说也是
F7TsdQL45E0jmoiG
268 天前
服务器内存有 ecc 校验
F7TsdQL45E0jmoiG
268 天前
另外,disable cpu 超线程
ShuWei
268 天前
极大概率是代码的锅
laqow
268 天前
下载国外数据大概率出错是国内网络特色。另外如果通过移动机械硬盘拷贝 10G 以上数据大概率会出现写入错误,应该用带校正的软件拷贝。ubuntu 默认是缓存读写硬盘,卸载移动硬盘前应该运行 sync 合并缓存。
python 和 R 原生都是假的多线程,使用 sock 方式实现共享内存时需要复制主进程所有内存,很容易就内存不足。ubuntu 下可以使用 fork 方式实现内存共享。
imlm
263 天前
生信数据库数据 md5sum 校验出问题大概率是网络问题,特别是特别大的 fq 文件,建议更换网络。有些时候为了防止传输 fq 文件中的出错,我会选择做私人种子传输😓
tomychen
258 天前
检查内存吧 当年撸了个 copy file 因为内存问题,搞得我怀疑人生,直到有一天,我无意中 cp xxx.iso /tmp/xxx.iso
然后 再 check md5 才发现错怪了自己
faoisdjioga
235 天前
测试了很多。mmtest 显示内存有问题。
不打算继续买内存做测试了。大概率是内存的问题。CPU 和其他硬盘都测了,没有问题。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1014825

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX