<div id="tranData">
<div class="tyfrom">
<div id="home"><img src="/img/223325.png" width="80" height="80"></div>
</div>
<div class="fat4">
<table width="100%" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<th colspan="5" class="abc" align="center">
课程表
</th>
</tr>
</table>
</div>
<div class="content">
<table width="800" cellspacing="0" cellpadding="0" align="center">
<tbody>
<tr><th colspan="5" class="pit" align="center">哑铃</th></tr>
<td></td>
</tbody>
</table>
</div>
<div class="content">
<table width="800" cellspacing="0" cellpadding="0" align="center">
<tbody>
<tr><th colspan="5" class="pit" align="center">跑步机</th></tr>
<td>
<tr align="center">
<td class="a1" width="320">
<a href="http://192.168.1.155/sport/record/id1661.html" target="_blank" title="38 分钟">38 分钟</a>
</td>
<td class="a7" width="30">
<img src="/img/sh_img/finish.png" title="" style="cursor:pointer;">
</td>
<td class="a3" width="100">38Min.</td>
<td class="a1" width="30">14:29</td>
<td class="a3" width="320">15:07</td>
</tr>
</td>
</tbody>
</table>
</div>
<div class="content">
<table width="800" cellspacing="0" cellpadding="0" align="center">
<tbody>
<tr><th colspan="5" class="pit" align="center">踏步机</th></tr>
<td></td>
</tbody>
</table>
</div>
考虑到方便表达 html 代码的结构,瘦身了内容,调整了代码格式缩进,方便大家理解我的问题
1、通过 xpath,定位到了
//*[@id="tranData"]
2、我想提取 tranData 节点,下面的跑步机内容,在这个代码中是 content[2],但页面会根据情况变化,有可能会是[6]/[7]/[8]这样。在'跑步机'所在的 content 节点里,唯一特征就是有跑步机三个字了(对,就是 text()),其它的 content 格式是一致的
3、etree.xpath,html.xpath 用什么方法能定位到这个 content,并把节点的代码弄出来呢?
4、如何按顺序提取跑步机 content 下面的 td 的 text()内容? (td 的 class 并不是每条记录都固定是 a*)
感谢大家热心解答!!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.