zhxjdwh
V2EX  ›  问与答

使用 impala insert, hive insert 后 表查询性能出现巨大的差距?

  •  
  •   zhxjdwh · Feb 5, 2020 · 1734 views
    This topic created in 2298 days ago, the information mentioned may be changed or developed.

    源数据表是a , 目标数据表是b, 格式:parquet-snappy

    insert sql: insert owerwrite table b select * from a

    1. 使用 impala 执行 insert sql , 再用 impala 对 b 表查询
    2. 使用 hive 执行 insert sql ,再用 impala invalidate metadata/ refresh table, 再用 impala 对 b 表查询

    用 impala 查询这两种方式 生成的表数据,性能会差别非常大,impala insert的方式 比 hive insert性能要几十倍??为什么会这样子,同一个表,一模一样的数据

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5263 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 09:02 · PVG 17:02 · LAX 02:02 · JFK 05:02
    ♥ Do have faith in what you're doing.