光用正则不用Xpath/DOM,有些时候蛮抓瞎的,比如
<span class='a'><span class='b'>bbb<span>aaaa<span>
其中<span class='b'>bbb<span>
有时不出现
想提取出<span class='b'>bbb<span>aaaa
很难啊……
试了PHP的几个函数,似乎不支持有错误的Html/Xml?至少没有浏览器那么Robust的样子。
比如http://share.dmhy.org 这种在https://validator.w3.org 能查出1776个错误的网页。
原生PHP有没有办法解决?request_once
引用外部库也行,只要不上框架,不用编译PHP。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.