用 Python 作浏览器自动化操作应该选那个模块?

2017-11-02 08:52:33 +08:00
 meisky6666
5121 次点击
所在节点    Python
12 条回复
yanzixuan
2017-11-02 09:08:53 +08:00
谁说 selenium 没扩展?可以安装好所有东西后,在启动 selenium 的时候制定载入配置的路径啊。
lovestudykid
2017-11-02 10:25:17 +08:00
options = webdriver.ChromeOptions()
options.add_extension(EXT_PATH)
wq2016
2017-11-02 10:26:38 +08:00
selenium
meisky6666
2017-11-02 10:54:36 +08:00
@yanzixuan 我需要扩展有数据,不是全新安装的扩展,chrome 是账号登录的,启动的时候加了配置目录也没用啊
rffan
2017-11-02 10:55:22 +08:00
selenium 耐操好用,打开谷歌的时候截图只会截取显示的部分不会截取整张网页,略坑,建议用 phantomjs,会截取整张网页。其他的都好。用过其他的,都没这玩意好用。
meisky6666
2017-11-02 10:56:31 +08:00
@lovestudykid 那个扩展是我用文件夹直接拖进去的,要怎么加?
meisky6666
2017-11-02 11:12:17 +08:00
@rffan 暂时想到的是脚本精灵+bs4,ui 自动化 py 还是不好用
meisky6666
2017-11-02 11:13:44 +08:00
@meisky6666 按键精灵,打错了
iyaozhen
2017-11-02 11:23:54 +08:00
楼主这需求有点奇特呀。从正常测试的角度来说打开就应该是个新的浏览器,不然问题更多。
zbl430
2017-11-02 11:39:15 +08:00
meisky6666
2017-11-02 11:42:08 +08:00
@iyaozhen 因为有个爬虫扩展,之前就制定了很多网站的规则,效果很好,所以想直接收集上面的数据,自己实现这个爬虫有点难度
xmcp
2017-11-02 18:24:38 +08:00
selenium 可以呀,我就用 selenium 在 Travis-CI 上做 chrome 扩展的集成测试,一点问题都没有。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
opt=Options()
opt.add_argument('load-extension=%s'%'path/to/your/extension')
opt.add_argument('--user-agent=my_user_agent')
b=webdriver.Chrome(chrome_options=opt)

把扩展根目录放到 path/to/your/extension,然后就能正常加载了。

你的扩展可以用 navigator.userAgent 判断当前环境,初始化数据什么的就可以顺便做到了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/402809

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX