如何还原一个正在运行中的 Python 的程序代码?

2022-04-18 11:05:45 +08:00
thinkershare  thinkershare

我有一个正在运行中的 PyTorch 代码, 训练了一个神经网络(跑了大概四天了), 后来发现当时运行这的代码和参数都没有备份, 而原始代码被无意间覆盖了, git 也没有正确提交, 导致无法还原出参数了, 正在跑着的结果是最佳的, 我重新再次调试, 无论怎么也无法还原出现在正在训练着的这个结果. 现在这个 python 程序还在运行(非调试模式),大概一天后运行结束.想咨询下是否有办法 dump 整个进程, 然后反编译出原始代码, 程序跑在 Ubuntu 20.04(3090 的单卡, 没有使用分布式), Python 3.9

1649 次点击
所在节点   机器学习  机器学习
5 条回复
ThirdFlame
ThirdFlame
2022-04-18 11:09:51 +08:00
找找 pyc 文件
moyechen
moyechen
2022-04-18 12:12:40 +08:00
我在之前的编程经历中使用过 gdb 调试 python 程序,通过 python-gdb 扩展可以看到当前执行的行的源代码,不知道是否可以看到全部的源代码。但是可能有风险,导致进程死掉,建议博主自己测试下

https://wiki.python.org/moin/DebuggingWithGdb
如果进程已在运行,只要您知道进程 ID ,就可以附加到该进程。
$ gdb python <pid of running process>
附加到像这样正在运行的进程将导致它停止。您可以告诉它继续使用 c 命令运行。

https://sourceware.org/gdb/onlinedocs/gdb/List.html#List
thinkershare
thinkershare
2022-04-18 12:27:48 +08:00
@moyechen 好些, 我先试一试, pyc 文件也被覆盖掉了, 就比较悲催
moyechen
moyechen
2022-04-18 13:09:15 +08:00
@thinkershare 抱歉,原来这个 gdb 也是打开源文件才能显示代码的。我删除以后显示不了了
(gdb) py-list
Unable to open t.py: [Errno 2] No such file or directory: b't.py'
thinkershare
thinkershare
2022-04-18 13:47:49 +08:00
@moyechen 我现在的想法是先将整个进程 dump 出来, 然后在使用分析工具找到已加载的字节码, 然后看不能不能反编译字节码

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/847605

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX