请问有什么软件可以精简 html 代码?

2017-11-03 22:09:03 +08:00
 vtoexsir
像这样的 html 代码:
<p><span>[3]</span><span>殷明</span><span>.</span><span>关于线性代数教材结构教法及建设的思考</span><span>[J].</span><span>合肥工业大学学报:社会科学版,</span><span>2002</span><span>(</span><span>2</span><span>):</span><span>108-120.</span></p>

可以精简为:
<p>[3]殷明.关于线性代数教材结构教法及建设的思考[J].合肥工业大学学报:社会科学版,2002 ( 2 ):108-120.</p>

请问有没有什么软件,可以批量精简 html 代码?
5413 次点击
所在节点    HTML
10 条回复
cy97cool
2017-11-03 23:54:36 +08:00
python 直接 replace("<span>","").replace("</span>","")可好?

![]( https://d.py3.io/img/bzszSrs2ZBhBiJ5E.png)
cy97cool
2017-11-03 23:57:30 +08:00
cy97cool
2017-11-03 23:58:09 +08:00
cy97cool
2017-11-03 23:59:07 +08:00
你也许可以看看的做汤(误)教程 → https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
isundust
2017-11-04 00:01:59 +08:00
文本编辑器或者代码编辑器查找替换成 空(空格)
autoxbc
2017-11-04 00:21:34 +08:00
如果就是例子代码那么简单,那正则就可以了

如果结构稍微复杂一点,那写出的正则像天书一样。可以试试先把 html 解析成 dom,然后用标准的 dom 方法对其操作。虽然性能不佳,但是写出的东西简单易维护
xfspace
2017-11-04 00:30:22 +08:00
Python HTMLParser
vtoexsir
2017-11-04 08:01:32 +08:00
感谢各位回复!
看来我没有说清楚,我举的例子,只是个例子,其实代码的各种情况都会有,修改的规则不是简单的替换 span 标签一种。
修改 span 标签,是目测看出来的。还有其他许多情况,目视才能发现。
我想使用软件,软件可以依据 html 的规则,自动发现这些需要修改的地方,自动修改。
hugee
2017-11-04 08:12:21 +08:00
我猜 lz 是要采集
zangbob
2017-11-04 11:29:00 +08:00
软件的没有,在线工具倒是有一个能完美达成要求的:

https://www.htmlwasher.com/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/403374

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX