V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
heywin
V2EX  ›  程序员

7 万多条的 json 如何储存检索

  •  
  •   heywin · Dec 15, 2018 · 3449 views
    This topic created in 2690 days ago, the information mentioned may be changed or developed.

    大概有 700 多个字段吧,总共 70000 多条。有什么好方法能存储及高效检索,以及数据可视化呢。 试过 Mysql, bigquery 好像都不怎么行。 谢谢

    tedd
        1
    tedd  
       Dec 15, 2018
    上 Elastic search ?
    tedd
        2
    tedd  
       Dec 15, 2018
    可视化 Elastic 全家福也能搞定
    lhx2008
        3
    lhx2008  
       Dec 15, 2018 via Android
    这么少直接导进去 mongo 就好了
    Vegetable
        4
    Vegetable  
       Dec 15, 2018
    json 如果是固定格式的,MySQL 不会不行吧
    嵌套的多就 MongoDB 咯,检索效率有保证,但是比较底层需要做的工作比较多.
    可视化就是另一个问题了,和储存关系不大,不评论啦
    jiezhi
        5
    jiezhi  
       Dec 15, 2018
    solr?
    F281M6Dh8DXpD1g2
        6
    F281M6Dh8DXpD1g2  
       Dec 15, 2018
    spark 处理一遍丢进 mysql,7 万多条很轻松的
    heywin
        7
    heywin  
    OP
       Dec 15, 2018
    @liprais 多谢,我也想过,太懒了。实在不行就用 PySpark 先搞一下。
    jimchen9999
        8
    jimchen9999  
       Dec 15, 2018   ❤️ 1
    7 万数据就用 spark 你还不如用 Bash
    heywin
        9
    heywin  
    OP
       Dec 15, 2018
    @jimchen9999 文件有 500 多 M,还是有点费劲。
    congeec
        10
    congeec  
       Dec 15, 2018
    700 多个字段是什么意思?
    heywin
        11
    heywin  
    OP
       Dec 15, 2018
    @congeec 不知道 json 黑话怎么说,键值对。
    sagaxu
        12
    sagaxu  
       Dec 16, 2018 via Android
    nuance2ex
        13
    nuance2ex  
       Dec 16, 2018 via iPhone   ❤️ 1
    70000 多条用 pandas 就可以了

    pd.read_json 秒秒钟转好格式,
    再直接调用 plt 调好参数函数可视化。

    最后,
    如果只是自用,可以调用 to_csv 保存
    如果想持久话,用 to_sql
    koodai
        14
    koodai  
       Dec 16, 2018 via iPhone
    @nuance2ex 你电脑啥配置呀?
    500M 加载起来有点费劲的
    heywin
        15
    heywin  
    OP
       Dec 16, 2018
    @nuance2ex 这个好!!!简单
    谢谢
    zchlwj
        16
    zchlwj  
       Dec 16, 2018 via Android
    直接 mongo 啊
    jimchen9999
        17
    jimchen9999  
       Dec 16, 2018
    500m 用 spark? spark 最起码都是 tb 起步吧
    missdeer
        18
    missdeer  
       Dec 16, 2018
    mongodb?
    sqlite3 也有 json 相关 api 了
    还有个 unqlite 好像也有
    imNull
        19
    imNull  
       Dec 16, 2018 via Android
    临时用的话,我一般都是直接 bash 跑下拿出需要的数据。
    不少新点子,mark
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4433 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 51ms · UTC 04:11 · PVG 12:11 · LAX 21:11 · JFK 00:11
    ♥ Do have faith in what you're doing.