想写一个用 Python 来抽取 xml 文件中的一些数据并转码
xml 如下
<?xml version="1.0" encoding="utf-8"?>
<config>
<HTTP>
<SITE NAME="HUNLIAN" DESCRIPTION="%E5%A9%9A%E6%81%8B" >
</SITE>
<SITE NAME="jiaoyou" DESCRIPTION="%E5%A9%9AB" >
</SITE>
</HTTP>
</config>
Python 如下
```
#!/usr/bin/python
#--coding:utf-8--
from xml.dom.minidom import parse
import xml.dom.minidom
import urllib
DOMTree = xml.dom.minidom.parse("xff.xml")
Data = DOMTree.documentElement
Sites = Data.getElementsByTagName("SITE")
for site in Sites:
L = "name: %s " %site.getAttribute("NAME")
M = "desc: %s" %site.getAttribute("DESCRIPTION")
url = urllib.unquote(M[0])
print L,M
f = open("info.txt", "a")
f.write(L+'\n'+M+'\n'+url+'\n')
f.close
结果如下:
name: HUNLIAN
desc: %E5%A9%9A%E6%81%8B
M(0)
name: jiaoyou
desc: %E5%A9%9AB
M(0)
实际想要的是 M(0)应该是 desc 的 URL 解码
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.