BeautifuSoup Helper - 制作爬虫小帮手,看看 find 选中了啥

2014-03-01 12:31:07 +08:00
 Esay
使用 BeautifulSoup 感觉不够直观,就写了一个的小工具,给选中的部分加上一个红框,欢迎大家使用、修改。



Source: https://github.com/Jeswang/beautiful-soup-helper
PS: 运行 Python 程序的部分用了 @binux 的一些代码,代码写得很规范,学到了很多,在这里特别感谢。
3882 次点击
所在节点    分享创造
7 条回复
xiaozi
2014-03-01 12:48:33 +08:00
直接使用chrome的xpath插件就可以了
9hills
2014-03-01 13:12:44 +08:00
嗯,chrome能直接得到xpath简直不要太赞,直接用lxml就好了
binux
2014-03-01 14:17:56 +08:00
https://gist.github.com/binux/9286057

还是css选择器语法简单
Esay
2014-03-01 22:07:17 +08:00
@binux

@xiaozi @9hills 确实好用,多谢推荐。有的时候还会需要想用用熟悉的 BeautifulSoup 嘛。
wangfeng3769
2014-05-26 17:02:19 +08:00
@Esay xp 下运行是不是有问题呀,老鸨内存泄漏问题。
wangfeng3769
2014-05-26 17:12:14 +08:00
Traceback (most recent call last):
File "E:\beautiful-soup-helper-master\beautiful-soup-helper-master\src\soup_helper.py", line 198, in <module>
dialog = MainWindow(None, "Soup Helper")
File "E:\beautiful-soup-helper-master\beautiful-soup-helper-master\src\soup_helper.py", line 63, in __init__
self.Bind(html2.EVT_WEB_VIEW_LOADED, self.LoadHTMLFihish, self.browser)
AttributeError: 'module' object has no attribute 'EVT_WEB_VIEW_LOADED'
swig/python detected a memory leak of type 'wxPyXmlSubclassFactory *', no destructor found.
Esay
2014-05-26 19:23:26 +08:00
额 搜索了一下,试下?

http://stackoverflow.com/questions/16460545/wxpython-passing-user-datas-to-html2

EVT_WEB_VIEW_LOADED -> EVT_WEBVIEW_LOADED

另外,Chrome 的 copy xpath 确实好用,也推荐你试试。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/102400

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX