用Hpple解析HTML时碰到的奇怪问题

2013-04-29 15:04:52 +08:00
 Cwind
我想从 http://www.gosugamers.net/starcraft2 抓点赛事信息,具体就是Upcoming matches、Started GosuBets以及Recent results三块内容,于是用了Hpple这个库,我是这样写的:
NSData *siteData = [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://www.gosugamers.net/starcraft2"]];

TFHpple *xpathParser = [[TFHpple alloc] initWithHTMLData:siteData];

upcomingArray = [xpathParser searchWithXPathQuery:@"//div[@id='box_latest_gosubets_upcoming_matches']/div[@class='last_middle']"];

startedArray = [xpathParser searchWithXPathQuery:@"//div[@id='box_latest_gosubets_started_gosubets']/div[@class='last_middle']"];

recentArray = [xpathParser searchWithXPathQuery:@"//div[@id='box_latest_gosubets_recent_results']/div[@class='last_middle']"];

前面两个没问题,把每一个<div class="last_middle">下的内容都找出来了,问题是recentArray, 它把10个div塞到一块去了,而且结构也乱掉了。
我看网页源代码中这三个部分挺工整的呀,就是id不同而已,不知道为什么前面工作的好好的,第三个就出错了,捉急呀。
3284 次点击
所在节点    iDev
2 条回复
xuan_lengyue
2013-04-29 19:14:19 +08:00
hpple太烂了,为啥不用正则表达式呢。
Cwind
2013-04-29 19:25:44 +08:00
@xuan_lengyue 因为我不会嘛,正打算开始学来着

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/67317

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX