本地抓取的网页如何方便的处理内容

2019-06-25 16:04:56 +08:00
 cnbot

我用 js 的 XMLHttpRequest 函数在本地抓取了网页内容(得到的内容是字符串),有什么办法可以通用比如

getElementById,之类的获取我想要的内容,就像用 js 操作网页那样方便。

1158 次点击
所在节点    问与答
2 条回复
bingyu1564
2019-06-25 16:18:48 +08:00
不好弄,推荐用 py 来爬,或者 phantom js 来处理。
cnbot
2019-06-25 18:14:03 +08:00
找到了一个函数 DOMParser 解决问题了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/577310

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX