管理 Jupyter Notebooks 的最佳实践(简化版)

2022-11-07 14:56:22 +08:00
 sadhen

这里有一个复杂一些的版本:管理 Jupyter Labs 和 Notebooks 的最佳实践

在今天的最佳实践中,我们解决的是,只有一个 requirements.txt 文件的这种情况。

上次的最佳实践,解决的是多个 requirements.txt 文件和多个目录的情况(启动 JupyterLab 的脚本会自动将该目录设置为根目录)。

马上试用

马上试用 Jupyter Notebook 最佳实践模版: https://github.com/da-tubi/jupyter-notebook-best-practice

git clone下来就可以用,或者使用 Github 那个绿色按钮Use this template

如何使用

下面简单说一下用法:

  1. bin/lab可以直接启动 JupyterLab
  2. 改 requirements.txt 的话,直接在notebooks/BUILD.pants里面改

另外,遇到什么问题,直接按照bin/lab的提示,就可以了。

Q: 为什么我没有找到requirements.txt?

A: 这里的requirements.txt,只是打个比方,具体使用了那些 Python 的包,可以在notebooks/BUILD.pants里面找到。

Q: 我在notebooks/BUILD.pants增加了 pytorch 这个依赖,为什么还是无法在 notebook 里面import pytorch

A: 更改依赖这个操作不是立即生效的,你仍旧需要使用bin/lab重新启动一下 JupyterLab (遇到什么问题,按照提示做即可)。

增删 requirements 的贴心教程

notebooks/BUILD.pants的内容预览:

# Put your dependencies in the requirements

jupyter_lab(name="default", requirements=["pyspark==3.3.0"])

如果你需要增加 pytorch 这个依赖,只要改成这样就可以了:

# Put your dependencies in the requirements

jupyter_lab(name="default", requirements=["pyspark==3.3.0", "pytorch"])
2167 次点击
所在节点    Python
1 条回复
sadhen
2022-11-07 18:17:04 +08:00
一个以上述最佳实践为模版的项目: https://github.com/da-tubi/rikai-example2

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/893320

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX