原生 PHP 有没有容错性好的 XPath/DOM 处理方法,能分析有错误的 Html/Xml?

2015-05-27 14:27:18 +08:00
 schezukNewTos

光用正则不用Xpath/DOM,有些时候蛮抓瞎的,比如
<span class='a'><span class='b'>bbb<span>aaaa<span>
其中<span class='b'>bbb<span>有时不出现
想提取出<span class='b'>bbb<span>aaaa很难啊……

试了PHP的几个函数,似乎不支持有错误的Html/Xml?至少没有浏览器那么Robust的样子。
比如http://share.dmhy.org 这种在https://validator.w3.org 能查出1776个错误的网页。
原生PHP有没有办法解决?request_once引用外部库也行,只要不上框架,不用编译PHP。

1959 次点击
所在节点    程序员
3 条回复
lianyue
2015-05-27 15:17:43 +08:00
lianyue
2015-05-27 15:22:52 +08:00
lianyue
2015-05-27 15:27:19 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/194109

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX