关于字符串转成 json 列表的问题

2020-03-09 19:03:47 +08:00
 jasonyun

一个字符串:

<!1!>3BA9CCE141782F12482585210023E5A4<file_unid>132277778533013248NH</file_unid><file_name>3 月会议计划(下发).xlsx</file_name><Ext>.xlsx</Ext><doc_unid>4825795A000CAA9048258523001F25C6</doc_unid></!1!><!2!>3BA9CCE141782F12482585210023E5A4<file_unid>132279467934597890NT</file_unid><file_name>通知( 3 月份会议计划).sep</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25C8</doc_unid></!2!><!3!>3BA9CCE141782F12482585210023E5A4<file_unid>132279468239173323NP</file_unid><file_name>通知( 3 月份会议计划).gw</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25CB</doc_unid></!3!>

怎么把他转成 json 的列表形式

[{'file_unid':'132277778533013248NH','file_name':'3 月会议计划(下发).xlsx','Ext':'.xlsx','doc_unid':'4825795A000CAA9048258523001F25C6'},{'file_unid':'132279467934597890NT','file_name':'通知( 3 月份会议计划).sep','doc_unid':'4825795A000CAA9048258523001F25C8'},.....]
2495 次点击
所在节点    Python
12 条回复
noreplay
2020-03-09 19:11:02 +08:00
先转成 XML?
festoney8
2020-03-09 19:32:21 +08:00
文本格式不规矩,先用正则把数字标签替换成单词,再按 xml 解析(比如上第三方库 xmltodict )
jasonyun
2020-03-09 19:38:45 +08:00
@noreplay 能具体说一下吗?
jasonyun
2020-03-09 19:39:09 +08:00
xml 只有一个根节点
ysc3839
2020-03-09 19:59:55 +08:00
数据比较规整,不考虑安全问题的话可以自己解析。感觉这样的数据解析起来也不难。
qiayue
2020-03-09 20:09:30 +08:00
先用正则替换
<!1!> 替换成 <list1>
</!1!> 替换成 </list1>
jasonyun
2020-03-09 21:03:10 +08:00
这个!会影响他解析成 xml
jasonyun
2020-03-09 21:56:13 +08:00
res=re.findall(r'<(!\d+!)>(.*?)</\1>',file_infos)
for n in res:
print(n[1][32:])
通过正则,我已经把他变成了带<>的类 json 数组的形式了
jasonyun
2020-03-09 22:12:46 +08:00
<file_unid>132277778533013248NH</file_unid><file_name>3 月会议计划(下发).xlsx</file_name><Ext>.xlsx</Ext><doc_unid>4825795A000CAA9048258523001F25C6</doc_unid>
<file_unid>132279467934597890NT</file_unid><file_name>通知( 3 月份会议计划).sep</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25C8</doc_unid>
<file_unid>132279468239173323NP</file_unid><file_name>通知( 3 月份会议计划).gw</file_name><Ext></Ext><doc_unid>4825795A000CAA9048258523001F25CB</doc_unid>
这个字符串数组怎么变成 json 数组
ChoateYao
2020-03-10 11:42:38 +08:00
自己写解析器啊,难道连个解析器都不会写吗?
Chenamy2017
2020-03-10 13:32:37 +08:00
这么有规律的字符串解析应当是基本操作的。
noreplay
2020-03-10 16:01:05 +08:00
其实可以把! 1 !的这种替换成 item1 这种,然后再把这段文字的前后加上<list></list>,这个就相当于一个 xml 文档了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/651296

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX