请教各位有什么好用的解析 Html 的 C++库吗?类似于 C# HtmlAgilityPack 那种功能比较丰富的。

2016-03-19 21:06:15 +08:00
 vincentjie

最近尝试用了下 CEF 做个小玩意。但是在解析 Html 的时候感觉其自带的 Document 相关的功能比较弱。不知道各位有没有 C++解析 Html 功能比较强大的开源项目推荐呢?之前用过的 C#下的 HtmlAgilityPack 感觉功能比较强大,例如根据 XPath 直接定位 Nodes 。而 C++比较常见的 Htmlcxx 功能相对就要弱一些了。 忽然发现一个Gumbo。

2028 次点击
所在节点    问与答
5 条回复
skydiver
2016-03-19 21:08:34 +08:00
比较常见的难道不是 libxml 之类的么
iuhux
2016-03-19 21:24:16 +08:00
zxgngl
2016-03-19 21:41:54 +08:00
An HTML5 parsing library in pure C99 (by Google)

https://github.com/google/gumbo-parser
3dwelcome
2016-03-20 10:13:08 +08:00
大部分动态网页都需要配合 js 解析吧、光 html 很多 ajax 网页都没办法处理。
vincentjie
2016-03-20 10:23:19 +08:00
@skydiver
@iuhux
@zxgngl
谢谢几位了。

@3dwelcome
现在想到的蠢办法是每次加载了新的内容的时候,把整个 Document 再解析一次。( ▼-▼ )

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/264799

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX