怎么样从一个含有 xml 标签的字符串中截取内容

2015-08-31 18:15:30 +08:00
 adrianzhang
一个字符串,含有标签。如下所示:
<string xmlns="http://schemas.microsoft.com/2003/10/Serialization/">Hello, how can I get to the railway station?</string>

问题:
这个内容(本例中是:“ Hello .... station?”)是变化的。
想只把内容取出来,也就是不要那些标签, Python 好像没有什么简单的办法?大家有没有好主意,一两条语句搞定,最好只使用标准库。
4174 次点击
所在节点    Python
25 条回复
racal
2015-09-01 00:54:46 +08:00
用正则轻松解决
TimePPT
2015-09-01 11:47:52 +08:00
Beautiful Soup 你值得拥有
TimePPT
2015-09-01 11:52:16 +08:00
好吧,没仔细审题,最好标准库...
guoqiao
2015-09-03 07:32:01 +08:00
关于这个问题, 如果只是一次性的, 我目前见到的最有创意的方法, 是在浏览器的控制台里, 用 jQuery 的选择器, 一行代码搞定. jQuery 虽然是针对 html 设计的, 但是在 xml 上一样好用.
即使不是一次性的, 也可以考虑用 Phantomjs + JQuery 等 JS 解决方案, 应当是最优雅的.
说 BS, PyQuery, lxml 的各位, 且不说这个几个库是否好用, 光是安装它们时的依赖问题, 就够让人烦的.
adrianzhang
2015-09-03 08:24:46 +08:00
@guoqiao 这是 python 程序编写过程中的一个小坎坷,用 jQuery 岂不是要安装相关的东东?我认为比较好的那个回复,采用的是标准库,不需要安装什么的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/217383

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX