1
Kacxxia 2019 年 2 月 24 日 https://regex101.com
推荐你用这个测试正则,右上会有语法解析 |
2
xiaozaiziwyt OP @Kacxxia 谢谢了。不过重新写代码后发现居然能运行了
|
3
fzinfz 2019 年 2 月 25 日 写这么长正则解析 html 的教程是为了找人切磋不是教人的吧,劝楼主另寻教程。。。关键词:bs4
|
4
msg7086 2019 年 2 月 25 日
比较好的办法是先用正则提取出主要数据,再用 XML / HTML 解析器解成结构化数据,再去读取遍历。
|
5
hakono 2019 年 2 月 25 日 via Android
楼主你看的么破教程啊,教人抽取复杂的网页用正则。。。。
乖乖去用 beautiful soup 去,一个 css 选择器就抽出来,节省自己点时间和生命吧 |
6
xpresslink 2019 年 2 月 25 日
建议楼主学习 一下 xPath 语法,写代码效率比正则要高多了,在 scrapy 中直接就可以用。 比较容易入手还是推荐 BS4
|
7
E1n 2019 年 2 月 25 日 via Android
正则写的爽
|
8
hjq98765 2019 年 2 月 25 日
bs4+1
|