关于使用 splash 的爬虫问题，手册让我懵逼了

文档在安装时候 https://splash.readthedocs.io/en/latest/install.html
使用 docker 安装类似‘ sudo docker run -p 8050:8050 -p 5023:5023 scrapinghub/splash ’的命令启动 splash

但是在文档代理的部分写着下面的话：
‘ If you run Splash using Docker, check Folders Sharing.’
“ https://splash.readthedocs.io/en/latest/api.html?highlight=proxy#proxy-profiles ”

看安装页都是使用 docker 安装这不都是使用 docker 安装的吗？ If u 是啥意思 splash 还有别的安装途径吗

PulpFunction

2018 年 8 月 17 日

但官网是还是推荐使用 docker 啊
代理又要文件共享，资料就屁一点

yuanfnadi

2018 年 8 月 17 日

你把 dockerfile 里面的命令改成 shell 脚本。不就是可以直接装 linux 上了么。

cz5424

2018 年 8 月 18 日

docker 跟代理两码事，完全不知道楼主在吐槽什么

我用 docker 装过 splash，scrapy 代理爬动态网页，没啥问题，就资源占用有点高

PulpFunction

2018 年 8 月 18 日

@cz5424 有关系的，如果不使用第三方库 scrapy-splash，代理只能走文件共享
昨天下午代理成了，是因为使用那个三方库了，主要问题是我代码瞎改……
关于资源占用，问一下老哥，splash 应该比 sele 那一套轻巧一点？好像没有回收内存的机制啊

@yuanfnadi 高深我一直在 linux 上调式的

XxxxD

2018 年 8 月 18 日

诶，我申请了 splash 的 develop 账号，给了一个 key 什么的，爬虫没问题啊，可以网上找无限制的 api key

cz5424

2018 年 8 月 19 日

@PulpFunction splash 就像一个隐藏的浏览器在跑网页，资源占用杠杠的，对比 chrome

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/480714

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.