如何用PHP 取DIV标签内容?

2013-05-18 13:23:00 +08:00
 beric
比如一个网页里面有之类的内容
<div id="XXX">
<div class="111"></div>
<div class="222"></div>
</div>

请问下如何用PHP简单地实现对<div id="XXX">之中的内容即<div class="111"></div>
<div class="222"></div>的提取?
10810 次点击
所在节点    PHP
14 条回复
vigoss
2013-05-18 13:30:27 +08:00
最终的网页都是php生成的,在响应之前你就该知道里面的内容。不然就用正则匹配吧
Tiny
2013-05-18 13:30:30 +08:00
这个不是用JS去取吗?
Paranoid
2013-05-18 13:33:05 +08:00
picasso250
2013-05-18 13:40:54 +08:00
php dom
http://php.net/manual/en/book.dom.php

或者简单但是不严谨的
/<div\s+id="XXX"\s*>\s*(((?'Open'<div).+?)+((?'-Open'<\/div)[^<]+))<\/div>/s
所以……你还是用dom吧
vigoss
2013-05-18 13:57:02 +08:00
我去,我理解错了。。原来是爬。。我用过3l的
66beta
2013-05-18 15:11:13 +08:00
send framework 貌似有该组件
Mutoo
2013-05-18 15:46:53 +08:00
发现了一个神奇的叫做 phpQuery 的开源库 https://code.google.com/p/phpquery/
可以像jQuery一样使用选择器
baby
2013-05-18 15:57:20 +08:00
xpath
Golevka
2013-05-19 02:25:44 +08:00
@vigoss 看到这个需求偶立即想到了反刍...
vigoss
2013-05-19 02:48:57 +08:00
@Golevka 啥是反刍?
ETiV
2013-05-19 06:01:26 +08:00
PHP 输出的 HTML, 再被 PHP 读回来解析的意思吧.
zava
2013-05-19 08:09:10 +08:00
同样推荐: http://simplehtmldom.sourceforge.net
用过的,不错。
beric
2013-05-19 10:17:53 +08:00
@Golevka PHP吐出的然后再用PHP吃回来,再吐出?
Xrong
2013-05-19 10:45:49 +08:00
楼主这应该是搞爬虫么,是的话就是上面推荐的SimpleHtmlDom非常好用的...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/69303

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX