有什么工具可以文本输出中处理 javascript 获取处理后的页面结果

2014-06-05 14:56:39 +08:00
 GPU
有人明白我的意思吗?

一个页面 他的页面结果是通过javascript 生成的内容 , 然后怎么通过 php 或者 shell 等等方式获取我要的内容 .


也就是通过各种程序语言 , 抓取到浏览器生成的内容. 输出到txt
2150 次点击
所在节点    问与答
5 条回复
rannnn
2014-06-05 15:03:58 +08:00
PhantomJS
imn1
2014-06-05 16:02:41 +08:00
凡是有js引擎的都可以,v8(php有这个),nodejs……
caomu
2014-06-05 17:01:14 +08:00
除了用js引擎模拟,也可以看看js具体了做什么,比如它是ajax从后端拉来了数据,就模拟请求然后本地解析处理,如果是对当前dom处理输出,就扒了页面html然后本地解析处理。一个想法,不一定对。
jerray
2014-06-06 11:56:06 +08:00
参见 seleniumhq http://docs.seleniumhq.org/

实际上这东西就是开个浏览器,给开发者提供了操作浏览器的接口。
GPU
2014-06-06 21:29:33 +08:00
@rannnn
@imn1
@caomu
@jerray
各位谢谢啦 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/115937

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX