求问想处理一个 21Gjson 文件需要怎么操作啊

2018-07-06 16:46:47 +08:00
 bfpiaoran
有人跟我说
with open("file_name",'r') as file:
for line in file:
pass
这样读可以的 有没有更好的方法呀
3183 次点击
所在节点    Python
30 条回复
wizardoz
2018-07-06 17:21:25 +08:00
自己从头解析啊,深度优先,一层层放入数据库。
FanWall
2018-07-06 17:22:00 +08:00
@814084764 #19
SAX +1,边读取边解析边对解析后的数据进行处理
bfpiaoran
2018-07-06 17:30:54 +08:00
@wizardoz 打算这么做了
crab
2018-07-06 17:32:28 +08:00
导入数据库,再通过数据库来
RicardoScofileld
2018-07-06 18:02:14 +08:00
有个流式读取 json 的库 好行叫 jsonstream 来着可以用那个
RicardoScofileld
2018-07-06 18:03:04 +08:00
@Droi 如果 json 数据不规整,read_json 不会报错吗
icyalala
2018-07-06 18:56:24 +08:00
mmap 然后用 SAX 的 API 读取。
如果用 C++ 的话,可以试试 rapidjson。
luozic
2018-07-08 01:56:59 +08:00
想办法处理一下,把数据搞进数据库。后面玩起来就爽了,elk,postgresql 都支持直接处理 json
bfpiaoran
2018-07-19 19:09:06 +08:00
@luozic 搞了下太慢了 最后把首字母排序处理的~~
luozic
2018-07-19 20:30:58 +08:00
@bfpiaoran 你得先把这些数据解析一下塞到数据库里面再搞,直接塞,太耗 cpu 内存了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/468711

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX