我有一个正在运行中的 PyTorch 代码, 训练了一个神经网络(跑了大概四天了), 后来发现当时运行这的代码和参数都没有备份, 而原始代码被无意间覆盖了, git 也没有正确提交, 导致无法还原出参数了, 正在跑着的结果是最佳的, 我重新再次调试, 无论怎么也无法还原出现在正在训练着的这个结果. 现在这个 python 程序还在运行(非调试模式),大概一天后运行结束.想咨询下是否有办法 dump 整个进程, 然后反编译出原始代码, 程序跑在 Ubuntu 20.04(3090 的单卡, 没有使用分布式), Python 3.9
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.