demo06 最近的时间轴更新
demo06

demo06

V2EX 第 195012 号会员,加入于 2016-10-08 14:11:10 +08:00
苦于 switch 游戏太贵不舍得买,欲搭个副号的车,可付费
二手交易  •  demo06  •  2019-12-13 12:05:26 PM  •  最后回复来自 gangsta
21
demo06 最近回复了
47 天前
回复了 gadzadlee 创建的主题 Android 求推荐一部安卓手机(备用机)
国行三星 S8,内存 128 以上的,做备用机无敌
为啥不考虑驱蚊液呢?我去年用驱蚊液度过了整个夏天,雷达的挺好用的喷身上能睡一晚上安稳觉
110 天前
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook 能帮到你就好,我也就刚好看过这块内容😂
110 天前
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
page = requests.post(url, headers=headers).text
tree = etree.HTML(page)
tables=tree.xpath('//table[@class="wikitable"]/caption[contains(text(),"返回数据说明")]/..')
for table in tables:
content=etree.tostring(table)
# result.decode('utf-8')
with open('./table.html','ab+') as fp:
fp.write(content)
print(content)
110 天前
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook 总结一下,用 xpath 获取 caption 包含 返回数据说明的子标签然后用 /.. 再获取他的父标签(我看了一下页面里面所有 table 的 class 都是 wikitable,用这种方法获取比较准确),然后 toString 后,获得的就是标准 table 表格
110 天前
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook 这样改就 OK 了
110 天前
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook tables=tree.xpath('//table[@class="wikitable"]/caption[contains(text(),"返回数据说明")]/..')
for table in tables:
print(etree.tostring(table, method='html', with_tail=False))
111 天前
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
你贴个 HTML 吧
关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2008 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 15:16 · PVG 23:16 · LAX 08:16 · JFK 11:16
♥ Do have faith in what you're doing.