请教个 html 解析的问题

2021-03-27 14:25:20 +08:00
 coolloves
最近写了个脚本抓电视节目自用,遇到了个小问题,请教下,对于一个标签内,我怎么判断 a 标签的内容是在前还是后啊?
如下情况,第一种 a 标签在后面呢,第二种情况,a 标签的内容就在前面,我目前是获取./span/text() + ./span/a/@href ,有些就是反的....
<span class="p_show">海豚万家剧场:<a title="康熙王朝剧情介绍 " href="/drama/MnJXVQ==">康熙王朝</a></span>
<span class="p_show"><a title="宇宙护卫队剧情介绍 " href="/drama/JFxhX2Nv">宇宙护卫队</a>2:爱探险的小梅花鹿</span>
988 次点击
所在节点    Python
2 条回复
tia
2021-03-27 14:31:02 +08:00
试试 beautifulsoup
coolloves
2021-03-27 14:44:10 +08:00
和 lxml 原理不一样吗?
bs 怎么判断前后呢?请教

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/765672

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX